Распознавание образов: из картинки в ТеХ

Сообщение №4029 от Konst 24 июня 2002 г. 15:05
Тема: Распознавание образов: из картинки в ТеХ

вопрос, видимо, в основном к Михалычу, как к занимающемуся этой темой.

Давно меня гложет желание иметь распознаватель математических текстов из отсканированной картинки скажем в ТеХ. Выполнима ли сейчас эта задача? вроде такой программы никто не видел.

Сложность написания такой программы принципиальная или чисто техническая, но просто слишком большая и никто не берется потому что овчинка выделки не стоит?


Отклики на это сообщение:

> вопрос, видимо, в основном к Михалычу, как к занимающемуся этой темой.

> Давно меня гложет желание иметь распознаватель математических текстов из отсканированной картинки скажем в ТеХ. Выполнима ли сейчас эта задача? вроде такой программы никто не видел.

> Сложность написания такой программы принципиальная или чисто техническая, но просто слишком большая и никто не берется потому что овчинка выделки не стоит?

Есть ABBY Finereader. Он правда распознает только текст но
на многих язаках. Сложность в основном чисто техническая. С другой стороны фирма должна же деньги получать за разработку, а рынка толком нет.




> Есть ABBY Finereader. Он правда распознает только текст но
> на многих язаках.
Это я и так знал.
обычный текст мне не очень интересно. Кроме того, качество распознавания там не очень..

> Сложность в основном чисто техническая. С другой стороны фирма должна же деньги получать за разработку, а рынка толком нет.
может рынка нет потому что продукта нет? если бы был продукт, то образовался бы рынок?



> Давно меня гложет желание иметь распознаватель математических текстов из отсканированной картинки скажем в ТеХ. Выполнима ли сейчас эта задача?

Думаю, что принципиально выполнима, но с каким качеством и за какой срок, не скажу.
Я сам некогда баловался простеньким программульками собственого изготовл для распознавания отдельных рукописных символов. Как-то мне хотели предложить утилитку написать для снятия текстовых копий с графического экрана.

> Сложность написания такой программы принципиальная или чисто техническая, но просто слишком большая и никто не берется потому что овчинка выделки не стоит?

По-моему преимущественно техническая, как следует из классической теории распознавания образов (напр, Гренандер, Распознавание образов, кажется).
На мой взгляд, из "принципиальных" м.б. те же, что и в обычном тексте, я думаю. Например, проблемы, аналогичные не связным или похожим символам (ы, i, l, 1, й), а также многоуровневость записи (индексы, пределы интегрир, знак интегр), еще больший набор символов (ведь часто пишут, кто во что горазд).

В обычных распознавалках существенно используют параметры стандартных шрифтов. Одно время они кричали, что нашли "фонтанное" преобразование (видимо от слова FONT), т.е. параметры, не зависящие от типа шрифта. Как на самом деле, я не в курсе.
Кстати, уже используются словари.
Может уже и контекст использ., не знаю.


Про FineReader & CuneiForm
Если там можно свои символы рисовать, то часть проблемы решается :-) + редактирование



> Про FineReader & CuneiForm
> Если там можно свои символы рисовать, то часть проблемы решается :-) + редактирование

мне кажется эти проги под виндой только живут.
или я ошибаюсь?
а книжку поищу, почитаю, спасибо.



-


Физика в анимациях - Купить диск - Тесты по физике - Графики on-line

Реклама:
Rambler's Top100