1

Vous connaissez un logiciel de reconnaissance de texte dans les images (OCR donc) qui puisse opérer à partir de fichier JPEG plutôt que directement avec l'image renvoyé par le scanner ?

Avec mon scanner HP je ne peux pas faire ça et c'est gênant sad

Thx

2

Tesseract ?
SimpleOCR ?

(et je suis pas sûr que du JPEG soit une bonne idée, vaudrait mieux un format non compressé en niveaux de gris)
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3

En fait j'ai des docs que j'ai scanné il y a longtemps et qui sont en jpeg, (de bonne qualité), et je préfèrerais les stocker sous forme de document, ce qui prendrais beaucoup moins de place.

4

Bah sinon tu les imprimes et tu les rescan.

dehors
Tout ce qui passe pas par le port 80, c'est de la triche.

5

ouais c'est une bonne idée picol .
Tesseract n'a pas l'air d'aimer mes images, mais SimpleOCR ne marche pas trop mal. Il a simplement un peu de mal avec les présentations en colonne.

6

Pour Tesseract, il faut d'abord convertir tes images en le format TIFF.
Il y a aussi GOCR et Ocrad (qui attendent le format PBM, donc là aussi il faut convertir).
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

7

Kevin -> J'ai jamais vu des OCR ausis minables sick

8

Omnipage permet de le faire, mais c'est un outil commercial (et assez cher). Par contre, j'ai toujours été surpris de son efficacité...
avatar

9

Il me semble avoir vu un menu d'OCR dans Irfanview, mais je ne l'ai jamais utilisé et je ne le retrouve plus cheeky
C'est peut-être un plugin installé uniquement au boulot.

10

Folco (./7) :
Kevin -> J'ai jamais vu des OCR ausis minables sick

Bah, j'ai déjà eu d'excellents résultats avec GOCR sur certains textes. En général, Tesseract est mieux, mais sur certaines sources, GOCR le bat. Quant à Ocrad, j'ai lu qu'il marche mieux que GOCR dans certains cas, mais je ne l'ai pas essayé. Et Tesseract est aussi mieux que Ocrad normalement.

En tout cas, tous les 3 sont packagés dans Fedora, on n'a que l'embarras du choix. smile
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

11

Moi j'ai omnipage packagé sur un XP virtuel, il corrige même les fautes d'orthographe s'ily en. Ce soft me laisse toujours assis par terre. embarrassed

12

(tu devrais prendre une chaise, c'est nettement plus confortable embarrassed)
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

13

Bah, tu utilises hunspell pour corriger les fautes d'orthographe. smile
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

14

(merci Flan, c'est pas con ! grin)

Kevin -> c'était une blague en fait,je savais pas qu'il y avait un correcteur orthographique grin

15

Et pour les corrections grammaticales ? grin
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

16

Les OCRs intègrent en général des correcteurs orthographiques pour corriger les fautes de reconnaissance ou décider en cas de doute (par exemple, si l'OCR ne sait pas s'il y a écrit "cheval" ou "chcval", le dictionnaire va lui dire que "cheval" est plus probable grin). Par exemple, Tesseract a des sortes de dictionnaires pour les langues à reconnaître. Ensuite, certains permettent aussi de faire une correction orthographique interactive après la reconnaissance, d'autres laissent cette tâche à un correcteur orthographique dédié.
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

17

avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

18

Au boulot nous utilisons ABBYY FineReader. Mes collègues, en sont très contents, c'est pourquoi j'en parle ici.
Perso, je n'ai pas d'avis car je ne l'ai pas testé.
Alors, il n'est pas gratuit, mais ce n'était pas précisé dans la question.