solr全文檢索入門第二篇 數據導入多種方式 post.jar和web

2015-12-01 11:20:00
hainuo
原創 3170
摘要:solr導入數據使用web和post.jar兩種方式
在上一節 我附帶瞭箇linux下的post命令工具用法來曏solr導入數據那麽在windows下這箇工具不能用,怎麽辦?#post.jar來看一下post.jar。通過哪裡可以得到這箇東西`solr-5.3.1\example\exampledocs\post.jar` 這箇版本是5.0.0的不知道怎麽迴事,在另一篇[solr教程](http://iamyida.iteye.com/blog/2207920 "solr教程")中,我髮現這箇東西在solr5.1的時候竟然是5.1.0 很奇怪,這裡不做討論。```PS D:\solr-5.3.1\solr-5.3.1\example\exampledocs> java -jar post.jar -hSimplePostTool version 5.0.0Usage: java [SystemProperties] -jar post.jar [-h|-] [ [ ...]]Supported System Properties and their defaults: -Dc= -Durl= (overrides -Dc option if specified) -Ddata=files|web|args|stdin (default=files) -Dtype= (default=application/xml) -Dhost= (default: localhost) -Dport= (default: 8983) -Dauto=yes|no (default=no) -Drecursive=yes|no| (default=0) -Ddelay= (default=0 for files, 10 for web) -Dfiletypes= [, ,...] (default=xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log) -Dparams=" = [& = ...]" (values must be URL-encoded) -Dcommit=yes|no (default=yes) -Doptimize=yes|no (default=no) -Dout=yes|no (default=no)This is a simple command line tool for POSTing raw data to a Solr port.NOTE: Specifying the url/core/collection name is mandatory.Data can be read from files specified as commandline args,URLs specified as args, as raw commandline arg strings or via STDIN.Examples: java -Dc=gettingstarted -jar post.jar *.xml java -Ddata=args -Dc=gettingstarted -jar post.jar ' 42 ' java -Ddata=stdin -Dc=gettingstarted -jar post.jar < hd.xml java -Ddata=web -Dc=gettingstarted -jar post.jar http://example.com/ java -Dtype=text/csv -Dc=gettingstarted -jar post.jar *.csv java -Dtype=application/json -Dc=gettingstarted -jar post.jar *.json java -Durl=http://localhost:8983/solr/techproducts/update/extract -Dparams=literal.id=pdf1 -jar post.jar solr-word.pdf java -Dauto -Dc=gettingstarted -jar post.jar * java -Dauto -Dc=gettingstarted -Drecursive -jar post.jar afolder java -Dauto -Dc=gettingstarted -Dfiletypes=ppt,html -jar post.jar afolderThe options controlled by System Properties include the SolrURL to POST to, the Content-Type of the data, whether a commitor optimize should be executed, and whether the response shouldbe written to STDOUT. If auto=yes the tool will try to set typeautomatically from file name. When posting rich documents thefile name will be propagated as "resource.name" and also usedas "literal.id". You may override these or any other request parameterthrough the -Dparams property. To do a commit only, use "-" as argument.The web mode is a simple crawler following links within domain, default delay=10s.```通過這箇幫助信息我們可以看到post.jar的用法```Examples: java -Dc=gettingstarted -jar post.jar *.xml java -Ddata=args -Dc=gettingstarted -jar post.jar ' 42 ' java -Ddata=stdin -Dc=gettingstarted -jar post.jar < hd.xml java -Ddata=web -Dc=gettingstarted -jar post.jar http://example.com/ java -Dtype=text/csv -Dc=gettingstarted -jar post.jar *.csv java -Dtype=application/json -Dc=gettingstarted -jar post.jar *.json java -Durl=http://localhost:8983/solr/techproducts/update/extract -Dparams=literal.id=pdf1 -jar post.jar solr-word.pdf java -Dauto -Dc=gettingstarted -jar post.jar * java -Dauto -Dc=gettingstarted -Drecursive -jar post.jar afolder java -Dauto -Dc=gettingstarted -Dfiletypes=ppt,html -jar post.jar afolder```結閤上麵的一些大長串的用法説明 上麵這幾箇例子,就很清楚瞭,-Dauto是自動 -Dc就是你要導入到哪一箇core中。在目録`\solr-5.3.1\example\exampledocs\`中已經存在不少的文檔可以直接被導入,你可以進行測試這裡我要説的是另一種方式web的方式管理。首先我們登陸web頁麵`http://localhost:8083`然後如圖所示![選擇core](http://blog.hainuo.info/data/upload/201512/f_f9fddc21c3536d28d82c30b23f588040.png "選擇core")我選擇的是`gettingstarted_shard1_replica2`![](http://blog.hainuo.info/data/upload/201512/f_5bf81fb06d9c97ca3a71e6c1ee6e91fd.png)就這樣搞定瞭,數據測試可以使用瞭。如何檢驗自己輸入的數據呢?![查詢結果](http://blog.hainuo.info/data/upload/201512/f_38ff33e0f66f9895b8ae10bb7692ef95.png "查詢結果")
發錶評論
玖 乘 貳 =
評論通過審核後顯示。