Thursday, February 17, 2011

Lucene VS Sphinx

Hmm..lagi nyari nyari tugas kuliah information retrieval tentang sphinxsearch jadi kepikiran knapa harus pakai sphinx yah? kenapa gak lucene aja? seengaknya kan lucene udah ada support dari zend (yang gw tau...gak tau klo sphinx :D), jadi pasti lebih banyak tutorial buat developer php yang mau gunain aplikasi search yang advance buat webnya :D
mungkin ini sedikit info tentang lucene dan sphinx yang gw dapetin.....

  • Lucene dan sphinx Gratis.....opensource engine
  • Sphinx di maintenance oleh Sphinx Technologies Inc dan di distribusikan dengan lisensi GPL
  • Lucene di maintenance oleh Apache Foundation dan di distribusikan dengan lisensi Apache 
 Arsitekturnya
  • Sphinx adalah stand alone server, dibuat dengan C++ dan dikeluarkan dengan indexing tool (indexer) dan seraching daemon (searchd), dan tool-tools yang lainnya.
  • Lucene proyek meliputi beberapa sub-proyek, terutama Lucene java, yang merupakan librarynya, dan Solr, yang merupakan stand alone server. Baik Java Lucene dan Solr berjalan di Java.
Feature
  • Lucene mendukung live indexing untuk indeks. 
  • Sphinx versi 0.9.x hanya mendukung rebuilding indeks keseluruhan. (Namun, bisa rebuiding "delta" indeks yang hanya berisi perubahan terbaru.)  
  • Sphinx versi 1.x mendukung dua indeks backends, "disk" yang hanya di rebuiding dari awal, dan "rt" yang mendukung live update.
  • Sphinx mendukung impor langsung dari MySQL, PostgreSQL, atau database ODBC compliant untuk kecepatan pengindeksan lebih cepat.  
Performance
  • Lucene dan Sphinx berdua sangat scaleable.  
  • Lucene digunakan di Wikipedia dan Digg. 
  • Sphinxdigunakan Craigslist, dan Slashdot
    mungkin segitu yang gw dapetin tentang perbandingan lucene dan sphinx, hmm jadi sebenernya mungkin enakan pakai lucene selain udah mendukung live indexing, suportnya juga sepertinya lebih oke :D
    klo sphinx hanya yang versi 1.x yang udah mendukung live index, buat yang gak tau live index itu apa, live indexing itu adalah fitur dimana kita gak perlu selalu mengindex ulang data indexing kita, jadi setiap ada data baru yang dimasukkan ke sistem, maka akan otomatis terindex, jadi gak perlu repot mengindex ulang lagi, fitur ini sangat membantu jika data kita besar, coba bayangin jika punya data 1000000 record, apakah setiap ada 1 data baru harus mengulang index dari 1 lagi? :D oleh karena itu fitur live indexing sangat penting :D, tapi kata dosen gw indexing di sphinx itu juga sangat cepat.. hmm jadi bingung pakai yang mana....
 sumber 

No comments: