บน Solr จะใช้ Apache Tika เป็นตัวจัดการ File Format ต่าง ๆ เช่น Apache PDFBox และ Apache POI ทำให้สามารถทำการอัพโหลด Binary File รวมถึงไฟล์พวก Word, PDF เพื่อทำ Data Extraction และ Indexing จึงถูกเรียกว่า Solr Content Extraction Library ( Solr Cell )
Solr เป็น Open Source Searcg Platform เขียนด้วยภาษา Java ของ Apache Software Foundation บน Apache Lucene Project ถูกออกแบบมาเพื่อใช้ในการจัดการเอกสารแบบ Full Text Search เหมาะสำหรับการทำเป็นสารานุกรม