Hungry Mind

Tiada kata terlambat untuk belajar

8/24/2009

Nutch Web Search

"8 998989 110167"

Dokumen ini berisi petunjuk untuk men-download dan menginstal Nutch dan Lucene. Please beware that you must be logged into the csci571 computer to run Apache Tomcat and not on aludra or nunki. Harap berhati-hati bahwa Anda harus login ke komputer untuk menjalankan csci571 Apache Tomcat dan bukan pada aludra atau nunki
Prasyarat
1. Java 1.4 Keatas. Anda dapat men-download java dari http://java.sun.com
2. Apache ANT 1.6 atau terbaru. Anda dapat men-download ANT dari http://ant.apache.org
3. Instalasi Apache Tomcat 5.5.19 atau di atas. Anda dapat men-download Tomcat dari http://tomcat.apache.org
4. Jika anda menggunakan Windows OS, silahkan install Cygwin: Anda dapat menemukan Cygwin di sini: http://www.cygwin.com/
5. Instal subversion, Anda dapat menemukan Subversion di: http://subversion.tigris.org
Petunjuk Instalasi
1. Download Nutch dari SVN, menggunakan command line Subversion:
# Svn co http://svn.apache.org/repos/asf/lucene/nutch/tags/release-0.8.1/. /Nutch

Command ini berarti mendownload nutch versi 0.8.1 kedalam folder baru Nutchdi tempat anda mengeksekusi command line ini. Ini akan menginstal Nutch ke dalam direktori yang disebut "Nutch" lokal dimanapun Anda eksekusi perintah ini. Jadi, jika Anda menjalankan perintah ini dari /home/ismail, maka Anda akan memiliki direktori bernama /home/ismail/Nutch
direktori di mana Anda memasang Nutch akan sering disebut $NUTCH_HOME. Untuk mengexportnya gunakan perintah
#export NUTCH_HOME=/home/ismail/nutch [path nutch folder tempat anda simpan]
2. Cd ke direktori Nutch, dan kompilasi Nutch:

# cd /home/ismail/nutch
# ant
1. Anda akan melihat pesan seperti berikut jika semua berjalan baik dan building berhasil.

compile:
job:
[jar] Building jar: /home/ismail/nutch/build/nutch-0.8.1.job [jar] Building jar: / home/ismail/nutch/build/nutch-0.8.1.job

BUILD SUCCESSFUL BUILD SUCCESSFUL

Total time: 27 second
3. Oke, sekarang Nutch sudah terpasang, Sekarang anda dapat Fetching beberapa konten. Ada instruksi langkah-demi-langkah secara rinci pada wiki, untuk bagaimana untuk mengambil konten. Halaman ini berisi semua rincian: http://wiki.apache.org/nutch/NutchTutorial
Anda juga dapat melihat artikel Crawl
4. Setelah Anda mengambil beberapa konten, Anda mungkin ingin menelusuri konten tadi.Untuk dapat memasang nutch pada tomcat, anda diharuskan untuk membuat webapp dengan command
# ant war
Perintah di atas akan membangun file nutch-0.8.1.war dalam $ NUTCH_HOME / build. Command ini juga menghasilkan file nutch.xml dalam $NUTCH_HOME /build. Nutch.xml adalah context.xml Tomcat file, yang dapat Anda gunakan untuk mengkonfigurasi file War untuk ditempatkan di dalam Tomcat.

5. Pertama, buat direktori untuk file Nutch.war, dan file context.xml Misalnya, file tersebut dimasukan /usr/local/Nutch adalah tempat yang baik.
6. # mkdir /usr/local/nutch
# cp –R $NUTCH_HOME/build/nutch-0.8.1.war /usr/local/nutch
# cp –R $NUTCH_HOME/build/nutch.xml /usr/local/nutch
7. Edit /usr/local/Nutch/nutch.xml dimana pada property searcher.dir tambahkan alamat penuh crawl nutch_home. Misalkan awalnya hanya firstcrawl maka kasus ini menjadi /home/ismail/nutch/firstcrawl. Edit docBase Attribute pada context tag menjadi path penuh ke folder nutch war file tadi e.g. /usr/local/nutch/nutch-0.8.1.war
8. Matikan service Tomcat terlebih dahulu.
Buatlah link ke context.xml file untuk Nutch ke direktori Tomcat
#$TOMCAT_HOME/bin/shutdown.sh
#ln –s /usr/local/nutch/nutch.xml $TOMCAT_HOME/conf/Catalina/localhost/nutch.xml
Restart Tomcat service
$TOMCAT_HOME/bin/startup.sh
(Pada kasus diatas, kita harus mendefinisikan terlebih dahulu TOMCAT_HOME dengan mengeksport alamat foldernya. Contoh #export TOMCAT_HOME=/opt/tomcat)
9. Jika sesuai dengan yang diharapkan, kunjungilah http://localhost:8080. Maka anda akan mendapatkan halaman depan dari NUTCH.

Label: , ,

0 Komentar:

Posting Komentar

Berlangganan Posting Komentar [Atom]

<< Beranda