Je reprends ce sujet intéressant pour les besoins de ma nouvelle application.
Je suis entrain de travailler sur un algo permettant de récupérer le montant d'un ticket de caisse.
L'idée: Photo du reçu et calcul du montant reçu.
Pour gérer la perspective de la photo j'ai a peu près le même résultat que Scannable (app evernote) travailler avec OpenCV.
Par contre pour récupérer le prix j'utilise tesseract. J'ai beau améliorer le contraste grâce à GPUImage mais le résultat n'est pas convenable. Mon algo marche super bien pour une plaque d'immatriculation mais pas pour mon petit ticket de caisse.
Et deuxième difficulté, il me faudrait savoir la taille de la font sur l'image pour en déduire (pour certain cas) plus facilement le prix.
Avez vous avancé sur cette problématique de votre côté ?
K.
PI: Je suis en mode MVP, du coup je ne peux pas me permettre de payer une librairie.
Attention les prix, vu ma base, ça pourrait être du 1000€ au mois...
Par contre, la reconnaissance est juste terrible !!! Je suis bleuffé.
---
Je teste parallèlement cette solution OpenSource qui s'appuie sur OpenCV: http://pastec.iosur Ubuntu.
Cela marche plutôt bien. J'en suis à 3 images reconnues sur 4, mais j'ai des problèmes quand il n'y a pas assez de détails. Je continue à tester ces jours-ci.
Le développeur est sympa (français).
---
Enfin, j'ai testé Tesseract pour les cas ou OpenCV ne convient pas.
Mes résultats sont horribles.
Les étiquettes de vins ont trop de problématiques (polices différentes, inclinaison...etc).
En plus, je trouve Tesseract pas si simple pour le training et donc pour lui apprendre à analyser.
Je crois qu'il y a 2 autres librairies concurrentes mais moins de doc sur le net. On en parle dans ce doc:
C'est assez drôle, et visiblement le monde est petit:) Je travaille dans le même domaine que vous (vin) et j'étudie la même problématique (OCR, Reconnaissance d'images, ...) depuis un bon moment.
Pour avoir étudier l'ensemble des technos que vous présentez (Catchoom, Moodstocks, Kooaba, Pastec, ...), celle qui m'a le plus impressionné, est celle de Catchoom. Ils ont à disposition un SDK que vous pouvez utilisez sur vos propres serveur (donc d'être indépendant de leur serveur). Evidemment, le prix n'est pas anodin, mais accessible (environ $15.000).
Quant à la techno Tesseract, j'ai fais développer des modules d'optimisation spécifique à la reconnaissance des étiquettes de bouteille de vins, le résultat sont déjà meilleurs mais pas assez satisfaisants.
C'est assez drôle, et visiblement le monde est petit:) Je travaille dans le même domaine que vous (vin) et j'étudie la même problématique (OCR, Reconnaissance d'images, ...) depuis un bon moment.
Sur quelle application ?
Pour avoir étudier l'ensemble des technos que vous présentez (Catchoom, Moodstocks, Kooaba, Pastec, ...), celle qui m'a le plus impressionné, est celle de Catchoom.
Je confirme. Je n'ai eu que des résultats positifs.
J'ai aussi testé TinyEye (qui n'était pas dans la liste) utilisée par quelques concurrents.
Ils ont à disposition un SDK que vous pouvez utilisez sur vos propres serveur (donc d'être indépendant de leur serveur). Evidemment, le prix n'est pas anodin, mais accessible (environ $15.000).
ça peut-être intéressant en effet.
Je suis en contact avec un gars de Catchoom depuis deux mois qui a l'air "à l'écoute".
J'ai testé Pastec avec une autre branche, j'arrive à environ 70% de reconnaissance, ce qui n'est pas mal pour du gratuit, mais il faut soigner la taille de l'image, sa qualité, la prise de vue... et il est assez mauvais sur les étiquettes foncées (heureusement, 90% des étiquettes sont sur fond blanc). Je pensais partir avec ça "dans un premier temps".
Quant à la techno Tesseract, j'ai fais développer des modules d'optimisation spécifique à la reconnaissance des étiquettes de bouteille de vins, le résultat sont déjà meilleurs mais pas assez satisfaisants.
J'ai un peu laissé de côté cette techno.
Le problème pour nous, c'est la quantité d'images à avoir en base pour analyse: des centaines de milliers, et c'est ça qui coûte cher.
---
Sinon, j'ai pas trop avancé, dans le sens où ma base n'est pas encore structurée ni triée. C'est en cours. Et sans base propre, ça ne sert à rien d'investir dans la reco d'image, chaque chose en son temps. Il y aura évidemment une recherche textuelle en plus "intelligente".
Je travaille pour divers sociétés, mais globalement, j'ai écrit plusieurs applications, mais pas systématiquement public (dans le domaine des vins), à part VALP (iphone/ipad), les autres applications sont en in-house, destinés aux professionnels du vin (vignerons indépendants, agents, caviste, restaurants, ...)
Aussi, connaissez-vous des sociétés sur le marché, offrant un service d'abonnement (ou vente), permettant d'interroger une base de données de vin (via une api), plutôt sur les vins français ?
Le but dans 1er temps, serait d'avoir un minimum d'informations sur le vin, quite à complèter la fiche de vin manuellement en associant des informations complémentaires (domaine, mets, photo, ...)
Aussi, connaissez-vous des sociétés sur le marché, offrant un service d'abonnement (ou vente), permettant d'interroger une base de données de vin (via une api), plutôt sur les vins français ?
J'ai souvent cherché cela, sans succès.
Même au niveau international.
Trouver une base de données de qualité est compliqué. Je me suis servi un temps de wine-searcher.com (beaucoup de références, mais données limitées, voire mal classées).
Réponses
6000€ / an
Pas loin.
4000€/an + 4% des ventes
T'as fait des essais avec leur système ? Combien de temps ça prend pour une étiquette de vin ?
Non, je n'ai pas fait d'essai de la techno elle-même.
J'ai juste fait des essais sur la base louée.
Qui a un Mac Pro sous la main ?
Bonjour,
Je reprends ce sujet intéressant pour les besoins de ma nouvelle application.
Je suis entrain de travailler sur un algo permettant de récupérer le montant d'un ticket de caisse.
L'idée: Photo du reçu et calcul du montant reçu.
Pour gérer la perspective de la photo j'ai a peu près le même résultat que Scannable (app evernote) travailler avec OpenCV.
Par contre pour récupérer le prix j'utilise tesseract. J'ai beau améliorer le contraste grâce à GPUImage mais le résultat n'est pas convenable. Mon algo marche super bien pour une plaque d'immatriculation mais pas pour mon petit ticket de caisse.
Et deuxième difficulté, il me faudrait savoir la taille de la font sur l'image pour en déduire (pour certain cas) plus facilement le prix.
Avez vous avancé sur cette problématique de votre côté ?
K.
PI: Je suis en mode MVP, du coup je ne peux pas me permettre de payer une librairie.
Merci pour vos retours.
Salut,
Pour mes besoins, j'ai trouvé 2 solutions clés en main, mais bonjour les prix:
- Catchoom - Image Recognition and Augmented Reality
- Moodstocks - https://moodstocks.com
Attention les prix, vu ma base, ça pourrait être du 1000€ au mois...
Par contre, la reconnaissance est juste terrible !!! Je suis bleuffé.
---
Je teste parallèlement cette solution OpenSource qui s'appuie sur OpenCV: http://pastec.iosur Ubuntu.
Cela marche plutôt bien. J'en suis à 3 images reconnues sur 4, mais j'ai des problèmes quand il n'y a pas assez de détails. Je continue à tester ces jours-ci.
Le développeur est sympa (français).
---
Enfin, j'ai testé Tesseract pour les cas ou OpenCV ne convient pas.
Mes résultats sont horribles.
Les étiquettes de vins ont trop de problématiques (polices différentes, inclinaison...etc).
En plus, je trouve Tesseract pas si simple pour le training et donc pour lui apprendre à analyser.
Je crois qu'il y a 2 autres librairies concurrentes mais moins de doc sur le net. On en parle dans ce doc:
http://www.seas.upenn.edu/~cse400/CSE400_2009_2010/final_report/Martinez.pdf
Sur quelle application ?
ça peut-être intéressant en effet.
Je suis en contact avec un gars de Catchoom depuis deux mois qui a l'air "à l'écoute".
J'ai testé Pastec avec une autre branche, j'arrive à environ 70% de reconnaissance, ce qui n'est pas mal pour du gratuit, mais il faut soigner la taille de l'image, sa qualité, la prise de vue... et il est assez mauvais sur les étiquettes foncées (heureusement, 90% des étiquettes sont sur fond blanc). Je pensais partir avec ça "dans un premier temps".
J'ai un peu laissé de côté cette techno.
Le problème pour nous, c'est la quantité d'images à avoir en base pour analyse: des centaines de milliers, et c'est ça qui coûte cher.
---
Sinon, j'ai pas trop avancé, dans le sens où ma base n'est pas encore structurée ni triée. C'est en cours. Et sans base propre, ça ne sert à rien d'investir dans la reco d'image, chaque chose en son temps. Il y aura évidemment une recherche textuelle en plus "intelligente".
Je travaille pour divers sociétés, mais globalement, j'ai écrit plusieurs applications, mais pas systématiquement public (dans le domaine des vins), à part VALP (iphone/ipad), les autres applications sont en in-house, destinés aux professionnels du vin (vignerons indépendants, agents, caviste, restaurants, ...)
Aussi, connaissez-vous des sociétés sur le marché, offrant un service d'abonnement (ou vente), permettant d'interroger une base de données de vin (via une api), plutôt sur les vins français ?
Le but dans 1er temps, serait d'avoir un minimum d'informations sur le vin, quite à complèter la fiche de vin manuellement en associant des informations complémentaires (domaine, mets, photo, ...)
Si vous avez des suggestions...:)
Merci
J'ai souvent cherché cela, sans succès.
Même au niveau international.
Trouver une base de données de qualité est compliqué. Je me suis servi un temps de wine-searcher.com (beaucoup de références, mais données limitées, voire mal classées).
http://www.wine-searcher.com/ws-api.lml
Les autres apps n'ont pas d'API publiques à ma connaissance. A moins de les contacter en privé... (je pense à Vivino par exemple).
C'est vrai, que cela fait un bon beau de temps que je cherche, sans vraiment trouvé.
Mais pour Vivinio, je penses que c'est un peu mort, d'autant plus au vu de leur levée de fonds (8M), je pense qu'ils ne sont pas près de partager...
Bref, il va falloir trouver une autre solution.
Merci
Snooth a un gros catalogue, mais je crois qu'il faut rentrer une clé.
https://api.snooth.com