<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Introduction à Solr &#8211; Installation et configuration (2)</title>
	<atom:link href="http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=introduction-a-solr-installation-et-configuration-2</link>
	<description>Moteurs de recherche d&#039;entreprise et verticaux</description>
	<lastBuildDate>Sun, 25 Dec 2011 18:48:55 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
	<item>
		<title>Par : Sheira</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-744</link>
		<dc:creator>Sheira</dc:creator>
		<pubDate>Thu, 20 Jan 2011 10:41:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-744</guid>
		<description>ok merci!
J&#039;ai configur&#233; Tika pour Solr (en rajoutant la librairie &quot;lib&quot; dans le r&#233;pertoire de solr) et pourtant lorsque je fais un &quot;curl &quot;http://localhost:8080/solr/update/extract?literal.id=doc1&amp;commit=true&quot; -F &quot;myfile=@tutorial.pdf&quot;
j&#039;ai l&#039;erreur suivante:
Etat HTTP 500 - lazy loading&#160;&#160;
error org.apache.solr.common.SolrException: lazy loading error
Caused by: java.lang.ClassNotFoundException: org.apache.solr.handler.extraction.&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; 
ExtractingRequestHandler
&#160;
pourtant dans mon solrconfig.xml, j&#039;ai bien:
&#160;
&lt;requestHandler name=&quot;/update/extract&quot; class=&quot;org.apache.solr.handler.extraction.ExtractingRequestHandler&quot; startup=&quot;lazy&quot;&gt;
	&#160;&#160;&#160; &lt;lst name=&quot;defaults&quot;&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;!-- All the main content goes into &quot;text&quot;... if you need to return
	&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; the extracted text or do highlighting, use a stored field. --&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;fmap.content&quot;&gt;text&lt;/str&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;lowernames&quot;&gt;true&lt;/str&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;uprefix&quot;&gt;ignored_&lt;/str&gt;
	
	&#160;&#160;&#160;&#160;&#160; &lt;!-- capture link hrefs but ignore div attributes --&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;captureAttr&quot;&gt;true&lt;/str&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;fmap.a&quot;&gt;links&lt;/str&gt;
	&#160;&#160;&#160;&#160;&#160; &lt;str name=&quot;fmap.div&quot;&gt;ignored_&lt;/str&gt;
	&#160;&#160;&#160; &lt;/lst&gt;
	&#160; &lt;/requestHandler&gt;
Si je n&#039;arrive pas &#224; solutionner le probl&#232;me, je serai oblig&#233; de me tourner vers une autre solution...je dois indexer 50 000 fichiers pour effectuer une recherche full-text .
Y a-t-il des cas d&#039;utilisation de solr?
Encore merci!

	
	&#160;

	
	&#160;</description>
		<content:encoded><![CDATA[<p>ok merci!<br />
J&#039;ai configur&eacute; Tika pour Solr (en rajoutant la librairie &quot;lib&quot; dans le r&eacute;pertoire de solr) et pourtant lorsque je fais un &quot;curl &quot;<a href="http://localhost:8080/solr/update/extract?literal.id=doc1&#038;commit=true&#038;quot" rel="nofollow">http://localhost:8080/solr/update/extract?literal.id=doc1&#038;commit=true&#038;quot</a>; -F &quot;myfile=@tutorial.pdf&quot;<br />
j&#039;ai l&#039;erreur suivante:<br />
Etat HTTP 500 &#8211; lazy loading&nbsp;&nbsp;<br />
error org.apache.solr.common.SolrException: lazy loading error<br />
Caused by: java.lang.ClassNotFoundException: org.apache.solr.handler.extraction.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br />
ExtractingRequestHandler<br />
&nbsp;<br />
pourtant dans mon solrconfig.xml, j&#039;ai bien:<br />
&nbsp;<br />
&lt;requestHandler name=&quot;/update/extract&quot; class=&quot;org.apache.solr.handler.extraction.ExtractingRequestHandler&quot; startup=&quot;lazy&quot;&gt;<br />
	&nbsp;&nbsp;&nbsp; &lt;lst name=&quot;defaults&quot;&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;!&#8211; All the main content goes into &quot;text&quot;&#8230; if you need to return<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; the extracted text or do highlighting, use a stored field. &#8211;&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;fmap.content&quot;&gt;text&lt;/str&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;lowernames&quot;&gt;true&lt;/str&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;uprefix&quot;&gt;ignored_&lt;/str&gt;</p>
<p>	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;!&#8211; capture link hrefs but ignore div attributes &#8211;&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;captureAttr&quot;&gt;true&lt;/str&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;fmap.a&quot;&gt;links&lt;/str&gt;<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;str name=&quot;fmap.div&quot;&gt;ignored_&lt;/str&gt;<br />
	&nbsp;&nbsp;&nbsp; &lt;/lst&gt;<br />
	&nbsp; &lt;/requestHandler&gt;<br />
Si je n&#039;arrive pas &agrave; solutionner le probl&egrave;me, je serai oblig&eacute; de me tourner vers une autre solution&#8230;je dois indexer 50 000 fichiers pour effectuer une recherche full-text .<br />
Y a-t-il des cas d&#039;utilisation de solr?<br />
Encore merci!</p>
<p>	&nbsp;</p>
<p>	&nbsp;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-743</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Thu, 20 Jan 2011 08:58:15 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-743</guid>
		<description>&lt;p&gt;Tika permet de d&#039;extraire le texte des documents bureautiques (doc, pdf, ...) afin d&#039;indexer ce texte dans Solr. Ni Tika, ni Solr ne sont en mesure de parcourir le syst&#232;me de fichier pour r&#233;aliser le traitement complet d&#039;indexation. Il vous faut mettre en place un programme qui parcourera le syst&#232;me de fichiers &#224; la recherche des documents &#224; indexer et qui pour chaque document :&lt;/p&gt;
&lt;p&gt;1. utilisera tika ou un autre outils pour en extraire le texte&lt;/p&gt;
&lt;p&gt;2. enverra ce texte dans Solr (accompagn&#233; d&#039;autres donn&#233;es (titre, url, nom de fichier, ...)&lt;/p&gt;
&lt;p&gt;Ensuite, il faut mettre en place une application de recherche qui utilisera cette index Solr&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Tika permet de d&#39;extraire le texte des documents bureautiques (doc, pdf, &#8230;) afin d&#39;indexer ce texte dans Solr. Ni Tika, ni Solr ne sont en mesure de parcourir le syst&egrave;me de fichier pour r&eacute;aliser le traitement complet d&#39;indexation. Il vous faut mettre en place un programme qui parcourera le syst&egrave;me de fichiers &agrave; la recherche des documents &agrave; indexer et qui pour chaque document :</p>
<p>1. utilisera tika ou un autre outils pour en extraire le texte</p>
<p>2. enverra ce texte dans Solr (accompagn&eacute; d&#39;autres donn&eacute;es (titre, url, nom de fichier, &#8230;)</p>
<p>Ensuite, il faut mettre en place une application de recherche qui utilisera cette index Solr</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Sheira</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-742</link>
		<dc:creator>Sheira</dc:creator>
		<pubDate>Thu, 20 Jan 2011 07:28:33 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-742</guid>
		<description>Les fichiers sont sur mon serveur. 
J&#039;ai vu que Tika &#233;tait install&#233; sur la version 1.4.1 de Solr, faut-il le configurer?
Et comment l&#039;utiliser, comment lui demander d&#039;indexer tous les fichiers d&#039;un r&#233;pertoire?
&#160;
Encore merci pour votre aide.
Corialement Sheira.
&#160;</description>
		<content:encoded><![CDATA[<p>Les fichiers sont sur mon serveur.<br />
J&#039;ai vu que Tika &eacute;tait install&eacute; sur la version 1.4.1 de Solr, faut-il le configurer?<br />
Et comment l&#039;utiliser, comment lui demander d&#039;indexer tous les fichiers d&#039;un r&eacute;pertoire?<br />
&nbsp;<br />
Encore merci pour votre aide.<br />
Corialement Sheira.<br />
&nbsp;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-741</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Mon, 27 Dec 2010 19:52:13 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-741</guid>
		<description>&lt;p&gt;Solr ne permet pas l&#039;indexation directe de ces formats de fichiers. Il faut mettre en place une &#233;tape pr&#233;alable de conversion de ces fichier vers un format texte. Il existe des outils et des librairies pour cela : Tika, pdftotext, catdoc, antiword.&lt;/p&gt;
&lt;p&gt;Ou sont localis&#233;s ces fichiers ? syst&#232;me de fichiers, sites web ?&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Solr ne permet pas l&#39;indexation directe de ces formats de fichiers. Il faut mettre en place une &eacute;tape pr&eacute;alable de conversion de ces fichier vers un format texte. Il existe des outils et des librairies pour cela : Tika, pdftotext, catdoc, antiword.</p>
<p>Ou sont localis&eacute;s ces fichiers ? syst&egrave;me de fichiers, sites web ?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : sheira</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-740</link>
		<dc:creator>sheira</dc:creator>
		<pubDate>Thu, 23 Dec 2010 19:36:21 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-740</guid>
		<description>Bonjour,
&#160;
J&#039;ai bien vu qu&#039;on pouvait indexer des fichiers xml avec Solr mais qu&#039;en est-il des fichiers doc, docx et pdf?&#160;
Y a-t-il une proc&#233;dure &#224; mettre en place? Si oui, laquelle?
&#160;
Merci d&#039;avance pour votre r&#233;ponse.
&#160;
Cordialement Sheira.</description>
		<content:encoded><![CDATA[<p>Bonjour,<br />
&nbsp;<br />
J&#039;ai bien vu qu&#039;on pouvait indexer des fichiers xml avec Solr mais qu&#039;en est-il des fichiers doc, docx et pdf?&nbsp;<br />
Y a-t-il une proc&eacute;dure &agrave; mettre en place? Si oui, laquelle?<br />
&nbsp;<br />
Merci d&#039;avance pour votre r&eacute;ponse.<br />
&nbsp;<br />
Cordialement Sheira.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : rem</title>
		<link>http://www.eolya.fr/2009/05/10/introduction-a-solr-installation-et-configuration-2/#comment-739</link>
		<dc:creator>rem</dc:creator>
		<pubDate>Tue, 15 Sep 2009 07:39:47 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=271#comment-739</guid>
		<description>aute solution : 

mettre dans catalina.bat : 

set JAVA_OPTS=%JAVA_OPTS% -Dsolr.home=%CD%solr

par exemple...

si quelqu&#039;un sais comment mettre cela dans un fichier de conf de tomcat ou dans solr je suis prenneur</description>
		<content:encoded><![CDATA[<p>aute solution : </p>
<p>mettre dans catalina.bat : </p>
<p>set JAVA_OPTS=%JAVA_OPTS% -Dsolr.home=%CD%solr</p>
<p>par exemple&#8230;</p>
<p>si quelqu&#8217;un sais comment mettre cela dans un fichier de conf de tomcat ou dans solr je suis prenneur</p>
]]></content:encoded>
	</item>
</channel>
</rss>

