<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Introduction à Lucene</title>
	<atom:link href="http://www.eolya.fr/2008/08/06/introduction-a-lucene/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=introduction-a-lucene</link>
	<description>Moteurs de recherche d&#039;entreprise et verticaux</description>
	<lastBuildDate>Sun, 25 Dec 2011 18:48:55 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
	<item>
		<title>Par : mchafi</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-71</link>
		<dc:creator>mchafi</dc:creator>
		<pubDate>Sat, 25 Jun 2011 10:35:45 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-71</guid>
		<description>&lt;span style=&quot;font-family: &#039;arial&#039;, &#039;sans-serif&#039;;font-size: 10pt&quot;&gt;&lt;font color=&quot;#000000&quot;&gt;Pour tester l&#8217;installation de Lucene en recherchant un terme dans le contenu index&#233; de l&#8217;ensemble de ses fichiers sources. comment en tapant la commande&#160;:&lt;/font&gt;&lt;/span&gt;
&lt;i&gt;&lt;span style=&quot;font-family: &#039;arial&#039;, &#039;sans-serif&#039;;font-size: 10pt&quot;&gt;&lt;font color=&quot;#000000&quot;&gt;java org.apache.lucene.demo.SearchFiles&lt;/font&gt;&lt;/span&gt;&lt;/i&gt;
&#160;
&lt;i&gt;&lt;span style=&quot;font-family: &#039;arial&#039;, &#039;sans-serif&#039;;font-size: 10pt&quot;&gt;&lt;font color=&quot;#000000&quot;&gt;merci&lt;/font&gt;&lt;/span&gt;&lt;/i&gt;</description>
		<content:encoded><![CDATA[<p><span style="font-family: 'arial', 'sans-serif';font-size: 10pt"><font color="#000000">Pour tester l&rsquo;installation de Lucene en recherchant un terme dans le contenu index&eacute; de l&rsquo;ensemble de ses fichiers sources. comment en tapant la commande&nbsp;:</font></span><br />
<i><span style="font-family: 'arial', 'sans-serif';font-size: 10pt"><font color="#000000">java org.apache.lucene.demo.SearchFiles</font></span></i><br />
&nbsp;<br />
<i><span style="font-family: 'arial', 'sans-serif';font-size: 10pt"><font color="#000000">merci</font></span></i></p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : lamine</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-70</link>
		<dc:creator>lamine</dc:creator>
		<pubDate>Mon, 18 Apr 2011 09:54:29 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-70</guid>
		<description>tres bonne introduction pour lucene , merci pour le code&#160;</description>
		<content:encoded><![CDATA[<p>tres bonne introduction pour lucene , merci pour le code&nbsp;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : jandet</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-69</link>
		<dc:creator>jandet</dc:creator>
		<pubDate>Thu, 17 Mar 2011 09:28:22 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-69</guid>
		<description>Bonjour,
je cherche &#224; modifier la methode de recherche vectorielle de lucene. Quelle(s) classe(s) dois-je modifier? Comment?
merci d&#039;avance</description>
		<content:encoded><![CDATA[<p>Bonjour,<br />
je cherche &agrave; modifier la methode de recherche vectorielle de lucene. Quelle(s) classe(s) dois-je modifier? Comment?<br />
merci d&#039;avance</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Pitt</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-68</link>
		<dc:creator>Pitt</dc:creator>
		<pubDate>Fri, 12 Nov 2010 15:29:09 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-68</guid>
		<description>Bonjour &#224; toutes et tous,
J&#039;utilse la recherche lucene sur mon applicatif (JAVA JEE, Lucene-analysers-2.1.0.jar)&#160;depuis en certain temps. Hors actuellement j&#039;ai un l&#233;ger soucis (qui doit dater !!!). En effet le parser semble me tronquer les mots cl&#233;s.&#160;Par contre aucun soucis avec les accents.
-------------------------------------------------------------------------------
Exemple :
&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;theKeyword = &quot;voie&quot;&lt;/font&gt;
&#160;
&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;parser.parse(theKeyword ) = &quot;voi&quot;&lt;/font&gt;

	&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;parser.parse(theKeyword.toUpperCase()) = &quot;voie&quot;&lt;/font&gt;&lt;/font&gt;
	
		&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;parser.parse(theKeyword.toLowerCase()) = &quot;voi&quot;&lt;/font&gt;&lt;/font&gt;
		&#160;
		&lt;font face=&quot;Arial&quot; size=&quot;2&quot;&gt;Idem pour &quot;Partie&quot; qui devient &quot;part&quot;, &quot;Cordialement&quot; qui devient &quot;Cordial&quot;. Par contre un mot comme &quot;&#233;pervir&#224;&quot; reste &quot;&#233;pervir&#224;&quot;... Bref je nage un peu...&lt;/font&gt;
	

Utiliser le toUpperCase() n&#039;est pas vraiment bon en soit car il ne recherchera que le mot cl&#233; en&#160;majuscule dans les fichiers d&#039;index.
-----------------------------------------------------------------------------------
&#160;
Voici mon code :
public static List findByKeyWords(String theKeyWords) throws ParseException, IOException {
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; log.info(&quot;Entr&#233;e dans la m&#233;thode --&gt; findByKeyWords&quot;); //$NON-NLS-1$
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; List candidatsList = new ArrayList();
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; FrenchAnalyzer analyser = new FrenchAnalyzer();
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; QueryParser parser = new QueryParser(KEYWORDS_FIELD, analyser);
&#160;&#160;&#160;&#160;&#160;&#160;&#160; Query query = parser.parse(theKeyWords);
&#160;&#160;&#160;&#160;&#160;&#160;&#160; IndexSearcher searcher = new IndexSearcher(REP_INDEX);
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; Hits hits = searcher.search(query);
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; for (int i = 0; i &lt; hits.length(); i++) {
	&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; Document doc = hits.doc(i);
	&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; candidatsList.add(new Integer(doc.get(ID_CANDIDAT)));
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; }
&#160;&#160;&#160;&#160;&#160;&#160;&#160; log.info(&quot;Sortie de la m&#233;thode --&gt; findByKeyWords&quot;); //$NON-NLS-1$
	&#160;&#160;&#160;&#160;&#160;&#160;&#160; return candidatsList;
	&#160;&#160;&#160; }
&#160;
Si vous avez une id&#233;e, ou pas ;-)
Merci.
&#160;</description>
		<content:encoded><![CDATA[<p>Bonjour &agrave; toutes et tous,<br />
J&#039;utilse la recherche lucene sur mon applicatif (JAVA JEE, Lucene-analysers-2.1.0.jar)&nbsp;depuis en certain temps. Hors actuellement j&#039;ai un l&eacute;ger soucis (qui doit dater !!!). En effet le parser semble me tronquer les mots cl&eacute;s.&nbsp;Par contre aucun soucis avec les accents.<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
Exemple :<br />
<font face="Arial" size="2">theKeyword = &quot;voie&quot;</font><br />
&nbsp;<br />
<font face="Arial" size="2">parser.parse(theKeyword ) = &quot;voi&quot;</font></p>
<p>	<font face="Arial" size="2"></font><font face="Arial" size="2">parser.parse(theKeyword.toUpperCase()) = &quot;voie&quot;</font></p>
<p>		<font face="Arial" size="2"></font><font face="Arial" size="2">parser.parse(theKeyword.toLowerCase()) = &quot;voi&quot;</font><br />
		&nbsp;<br />
		<font face="Arial" size="2">Idem pour &quot;Partie&quot; qui devient &quot;part&quot;, &quot;Cordialement&quot; qui devient &quot;Cordial&quot;. Par contre un mot comme &quot;&eacute;pervir&agrave;&quot; reste &quot;&eacute;pervir&agrave;&quot;&#8230; Bref je nage un peu&#8230;</font></p>
<p>Utiliser le toUpperCase() n&#039;est pas vraiment bon en soit car il ne recherchera que le mot cl&eacute; en&nbsp;majuscule dans les fichiers d&#039;index.<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
&nbsp;<br />
Voici mon code :<br />
public static List findByKeyWords(String theKeyWords) throws ParseException, IOException {<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; log.info(&quot;Entr&eacute;e dans la m&eacute;thode &#8211;&gt; findByKeyWords&quot;); //$NON-NLS-1$<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; List candidatsList = new ArrayList();<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; FrenchAnalyzer analyser = new FrenchAnalyzer();<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; QueryParser parser = new QueryParser(KEYWORDS_FIELD, analyser);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Query query = parser.parse(theKeyWords);<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; IndexSearcher searcher = new IndexSearcher(REP_INDEX);<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Hits hits = searcher.search(query);<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; for (int i = 0; i &lt; hits.length(); i++) {<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Document doc = hits.doc(i);<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; candidatsList.add(new Integer(doc.get(ID_CANDIDAT)));<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; log.info(&quot;Sortie de la m&eacute;thode &#8211;&gt; findByKeyWords&quot;); //$NON-NLS-1$<br />
	&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return candidatsList;<br />
	&nbsp;&nbsp;&nbsp; }<br />
&nbsp;<br />
Si vous avez une id&eacute;e, ou pas <img src='http://www.eolya.fr/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /><br />
Merci.<br />
&nbsp;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-67</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 18:04:32 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-67</guid>
		<description>Merci pour tous</description>
		<content:encoded><![CDATA[<p>Merci pour tous</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-66</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 10 Mar 2010 17:45:28 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-66</guid>
		<description>C&#039;est un peu juste comme information.</description>
		<content:encoded><![CDATA[<p>C&#8217;est un peu juste comme information.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-65</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 17:37:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-65</guid>
		<description>Salut 
Quand j&#039;utilise le filtre ISOLatin1AccentFilter,mon débogueur d&#039;ezpublish3.9.2 affiche ça   

Warning:  PHP  	Mar 10 2010 17:15:30

java.lang.Exception: CreateInstance failed: new org.apache.lucene.queryParser.MultiFieldQueryParser((String;)o(String;), (Analyzer)c(ISOLatin1AccentFilter)). Cause: java.lang.IllegalArgumentException: 

Est ce que l&#039;instanciation n&#039;est pas correct ?

Merci</description>
		<content:encoded><![CDATA[<p>Salut<br />
Quand j&#8217;utilise le filtre ISOLatin1AccentFilter,mon débogueur d&#8217;ezpublish3.9.2 affiche ça   </p>
<p>Warning:  PHP  	Mar 10 2010 17:15:30</p>
<p>java.lang.Exception: CreateInstance failed: new org.apache.lucene.queryParser.MultiFieldQueryParser((String;)o(String;), (Analyzer)c(ISOLatin1AccentFilter)). Cause: java.lang.IllegalArgumentException: </p>
<p>Est ce que l&#8217;instanciation n&#8217;est pas correct ?</p>
<p>Merci</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-64</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 10 Mar 2010 15:34:44 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-64</guid>
		<description>StandardAnalyzer est bien pour l&#039;anglais mais pas pour les langues européennes accentuées. Cet analyser fait :

* découpage en token
* normalisation en minuscule
* suppression des mots vides (paramétrable)

Il faudrait le dériver en un StandardISOLatinAnalyzer.
et surcharger les méthodes : 

  public TokenStream tokenStream(String fieldName, Reader reader)

  public TokenStream reusableTokenStream(String fieldName, Reader reader)</description>
		<content:encoded><![CDATA[<p>StandardAnalyzer est bien pour l&#8217;anglais mais pas pour les langues européennes accentuées. Cet analyser fait :</p>
<p>* découpage en token<br />
* normalisation en minuscule<br />
* suppression des mots vides (paramétrable)</p>
<p>Il faudrait le dériver en un StandardISOLatinAnalyzer.<br />
et surcharger les méthodes : </p>
<p>  public TokenStream tokenStream(String fieldName, Reader reader)</p>
<p>  public TokenStream reusableTokenStream(String fieldName, Reader reader)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-63</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 15:01:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-63</guid>
		<description>Bonjour
j&#039;utilise le filter StandardAnalyzer.
Est ce que ne marche pas avec ce filter .


Cordialement</description>
		<content:encoded><![CDATA[<p>Bonjour<br />
j&#8217;utilise le filter StandardAnalyzer.<br />
Est ce que ne marche pas avec ce filter .</p>
<p>Cordialement</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : dominique</title>
		<link>http://www.eolya.fr/2008/08/06/introduction-a-lucene/#comment-62</link>
		<dc:creator>dominique</dc:creator>
		<pubDate>Wed, 10 Mar 2010 14:25:28 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-62</guid>
		<description>@Walibda
Il faut utiliser lors de l&#039;indexation et de la recherche une analyzer qui inclura le filtre ISOLatin1AccentFilter.

Le but est de normaliser tous les caractères accentués dans leur forme non accentuée (éèê -&gt; e, î-&gt;i, ...). Ainsi, &quot;problème&quot; et &quot;probleme&quot; seront considérer comme identiques.</description>
		<content:encoded><![CDATA[<p>@Walibda<br />
Il faut utiliser lors de l&#8217;indexation et de la recherche une analyzer qui inclura le filtre ISOLatin1AccentFilter.</p>
<p>Le but est de normaliser tous les caractères accentués dans leur forme non accentuée (éèê -&gt; e, î-&gt;i, &#8230;). Ainsi, &laquo;&nbsp;problème&nbsp;&raquo; et &laquo;&nbsp;probleme&nbsp;&raquo; seront considérer comme identiques.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

