Бесплатная программа для распознавания текста (OCR)

github.com — Вероятно, кому-нибудь тоже будет полезно. Работает из командной строки. Есть версии для любой операционной системы. По моим наблюдениям работает лучше, чем FineReader.
Новости, Технологии | Злой 11:01 26.06.2019
146 комментариев | 103 за, 3 против |
#1 | 11:02 26.06.2019 | Кому: Всем
С Википедии (https://ru.wikipedia.org/wiki/Tesseract):

Tesseract (с англ. — «тессеракт») — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.
#2 | 11:06 26.06.2019 | Кому: Всем
Когда русский текст распознаёте надо использовать при вызове "-l rus". Тогда отлично распознает, а иначе будет какая-то лабуда.
#3 | 11:06 26.06.2019 | Кому: Всем
> Работает лучше FineReader.

И доказательства есть?
#4 | 11:07 26.06.2019 | Кому: Crypt
> И доказательства есть?

Личные наблюдения. Прогнал страницу через FineReader Online и через это.
Результат работы Tesseract лучше.
#5 | 11:07 26.06.2019 | Кому: Злой
> Когда русский текст распознаёте надо использовать при вызове "-l rus"

А приседать 3 раза не надо? Можно весь список 'надо'?
#6 | 11:08 26.06.2019 | Кому: Crypt
> А приседать 3 раза не надо?

Тебе надо.
#7 | 11:08 26.06.2019 | Кому: Злой
> Личные наблюдения. Прогнал страницу через FineReader Online и через это.
> Результат работы Tesseract лучше

Это всё слова. Обычно предоставляют оригинал и результаты. А сравнивают по нескольким тестам
#8 | 11:10 26.06.2019 | Кому: Crypt
> Это всё слова.

Ты лучше иди зажравшихся москвичей разоблачай.
#9 | 11:10 26.06.2019 | Кому: Злой
> > А приседать 3 раза не надо?
> Тебе надо.

Тогда обойдусь без этой прекрасной программы и продолжу пользоваться несчастным и позорным FR.
#10 | 11:11 26.06.2019 | Кому: Злой
> > Это всё слова.
> Ты лучше иди зажравшихся москвичей разоблачай.

Чуть попозжее. Сейчас обед.
#11 | 11:11 26.06.2019 | Кому: Crypt
> Тогда обойдусь без этой прекрасной программы

Ты прям расстроил меня...
#12 | 11:24 26.06.2019 | Кому: Всем
Без примеров все твои наблюдения ерунда. Лучше FR еще не встречал
#13 | 11:31 26.06.2019 | Кому: fantom
> Без примеров все твои наблюдения ерунда.

Попробуй сам. Я ни на чём не настаиваю. В моём случае результат работы этой штуки оказался лучше, чем результат работы FineReader.

Просто поделился с камрадами ссылкой на бесплатную программу, которая мне самому пригодилась.

> Лучше FR еще не встречал


Очень может быть. Кстати, сколько он стоит?
#14 | 11:33 26.06.2019 | Кому: Злой
А за него еще деньги какие-то платить надо ?
#15 | 11:34 26.06.2019 | Кому: Ябадабадун
> А за него еще деньги какие-то платить надо ?

Ты про FR? Если он не с торрентов, то да.
#16 | 11:42 26.06.2019 | Кому: Злой
> Кстати, сколько он стоит?

14-ая версия для дома - 8690 руб.
#17 | 11:54 26.06.2019 | Кому: Всем
О, как раз актуально сейчас. Спасибо!
#18 | 12:04 26.06.2019 | Кому: Vader
Глянь на Wiki, там есть ещё ссылки графические оболочки для этой штуки. И под Linux, и под Windows.
Хотя и из командной строки нормально работает.
#19 | 12:05 26.06.2019 | Кому: Всем
[Читает описание на Гитхабе]
Она консольная, что ли? Охуенный юзерфрендли в 2019 году. Ясен хер, для дома это гораздо удобнее, чем ФР.
Кто ж не любит трахаться с батниками, вместо того, чтоб нажать одну кнопку?!?
#20 | 12:07 26.06.2019 | Кому: Злой
> Хотя и из командной строки нормально работает.

Мне как раз консолька нужна, чтобы вкрячить в свой тул и автоматизировать часть операций, убрав человеков из ппоцесса :)
#21 | 12:40 26.06.2019 | Кому: Crypt
> Она консольная, что ли?

Да.

> Охуенный юзерфрендли в 2019 году.


Для юзерфрендли к ней есть графические оболочки для Windows и Linux, ссылки на которые можно найти на странице Википедии, посвященные ей. Оболочки тоже бесплатные.
Например:[censored]
Надо было эту информацию сообщить в первом комментарии. Не подумал об этом, так как сам предпочитаю работать в консоли. Привычка.

> Ясен хер, для дома это гораздо удобнее, чем ФР.


Для дома большинству пользователей удобнее будет использовать её с графической оболочкой.
#22 | 12:45 26.06.2019 | Кому: Всем
фантастика, спасибо
#23 | 12:49 26.06.2019 | Кому: Всем
активно пилится!
#24 | 12:54 26.06.2019 | Кому: Злой
> Для юзерфрендли к ней есть графические оболочки для Windows и Linux, ссылки на которые можно найти на странице Википедии, посвященные ей. Оболочки тоже бесплатные

А можно программу уже собранную и готовую к использованию? Что за блядский подход - вы можете делать всё сами и вам придётся делать всё самим?!?
#25 | 12:58 26.06.2019 | Кому: Crypt
> А можно программу уже собранную и готовую к использованию?

Можно. На Github, куда ведёт ссылка, написано: "This project does not include a GUI application. If you need one, please see the 3rdParty wiki page." 3rdParty кликабельно и ведёт сюда:[censored]

Ты говорил в комменте №19, что читал. Видимо, ты не понимаешь по английски. Я тебе перескажу. Там написано, что данный проект не включает в себя графической оболочки, но если она нужна, то одну из них можно скачать по ссылке. Ссылку я привёл выше.
#26 | 13:09 26.06.2019 | Кому: Crypt
> Что за блядский подход - вы можете делать всё сами и вам придётся делать всё самим?!?

Этот самый подход обеспечил миру Open Source тотальное доминирование в этих наших интернетах.

То, что ты лично не умеешь пользоваться консолью, не означает, что это никому не надо. Просто проходи мимо, не мучай себя.
#27 | 13:11 26.06.2019 | Кому: bezumkin
> То, что ты лично не умеешь пользоваться консолью, не означает, что это никому не надо.

Да более того: там не обязательно пользоваться консолью, есть GUI-надстройки над этим движком.
Просто человек хочет, чтобы ему всё разжевали и в клюв положили. Тогда, может быть, его всё более-менее устроит и он не будет на гавно исходить.
#28 | 13:24 26.06.2019 | Кому: Злой
Ты не понял того, что я написал и опять подсунул мне лего-солянку 'собери сам'.
#29 | 13:25 26.06.2019 | Кому: bezumkin
> То, что ты лично не умеешь пользоваться консолью

Откуда такой вывод?
#30 | 13:30 26.06.2019 | Кому: Crypt
> Ты не понял того, что я написал

Я как раз хорошо понял, что ты написал.

> подсунул мне


Тебе никто ничего не подсовывает. Можешь идти разоблачать москвичей. Обед кончился.
#31 | 13:35 26.06.2019 | Кому: Всем
Резюмирую. Граждане камрады оценили прошаренность автора в консолях и в умении написать-расшифровать список команд длиной 8 мониторов. Но нам простым крестьянам интересно соотношение: затраченное время-возможность работы. Поэтому FR.
#32 | 13:38 26.06.2019 | Кому: Всем
GUI и сама программулина устанавливаются из магазина linux. И да, бесплатно, только мышкой тыкай.
#33 | 13:41 26.06.2019 | Кому: Злой
> Можешь идти разоблачать москвичей

Да ты сам с этим прекрасно справился, без меня.
#34 | 13:46 26.06.2019 | Кому: Crypt
> Да ты сам с этим прекрасно справился, без меня.

Что ты имеешь в виду?
#35 | 14:19 26.06.2019 | Кому: Crypt
[censored]
#36 | 14:26 26.06.2019 | Кому: shatsky
Вот ты жестокий!!!
#37 | 18:49 26.06.2019 | Кому: Всем
Всем новичкам желающим перейти на пингвинью ОС сообщаю, вы получите работающую сеть, браузер, пакет офиса и некое подобие фотошопа. Для многих больше может и не нужно.
Будьте готовы, любые попытки что-либо установить сверх того, в том числе "из магазина Linux" может отправить к увлекательному изучению букваря с неочевидным результатом. Как то: ваша интегрированная видеокарта скорее всего не подддерживается, или: ваш процессор недостаточно рукопожат для ваших запросов. Никого не ругаю и не хвалю, пишу как есть. Есть желание и свободное время камлать возле монитора- в путь.
#38 | 20:03 26.06.2019 | Кому: Книга79
это какая видеокарта?
#39 | 20:07 26.06.2019 | Кому: Книга79
> пишу как есть

И зачем ты это пишешь в этом треде?
#40 | 20:13 26.06.2019 | Кому: cp866
> это какая видеокарта?

Со встроенными видеокартами действительно бывают проблемы. У меня в свое время не запускался фотошоп и система падала в БСОД при запуске более трех эксплоеров.
#41 | 20:18 26.06.2019 | Кому: Книга79
> Никого не ругаю и не хвалю, пишу как есть. Есть желание и свободное время камлать возле монитора- в путь.

Есть и другой путь: купить дорогущий Mac, внутри которого ОС на настоящем Unix, поддерживающая всё нужное железо и дофига софта. Есть полноценный терминал, можно добавить менеджер пакетов типа[censored] и собирать почти любой софт из мира GNU\Linux простейшими командами. Он скачает исходники, рецепт сборки, 10 минут - и софт готов для эксплуатации. Обсуждаемый tesseract там тоже есть.

Всё вылизано и великолепно работает, местами покруче Windows. Если не нужно что-то очень специфичное - то это лучший выбор для работы и дома.
#42 | 21:40 26.06.2019 | Кому: Книга79
По твоему комменту сразу видно человека, который когда-то давно, лет 15 назад, сталкивался с Linux и в ужасе вернулся к винде.

Более того, есть у меня ноут с неплохим железом. На нём была предустановлена Windows 8, которая потом обновилась до 10. Это просто какой-то трындец был как всё томрозило. Проблема решилась сносом Windows и установкой Linux. Теперь всё работает отлично.

Обсуждаемое ПО, тем временем, нормально работает в винде. Как из виндосовской командной строки, так и из графической оболочки.
#43 | 21:44 26.06.2019 | Кому: bezumkin
> Всё вылизано и великолепно работает, местами покруче Windows.

Это большой плюс.

> дорогущий Mac


Но вот это ещё больший минус.
#44 | 05:34 27.06.2019 | Кому: sobersober
Затем, что будьте готовы: с ходу все ваши привычные программы не переедут на Линукс, а может и в принципе не переедут.
Надо говотрить людям правду. Нюансов очень много, и о них скромно умалчивают.
#45 | 05:43 27.06.2019 | Кому: Злой
Докладываю. У меня сейчас стоит МИНТ19 паралельно с Виндой. На винде работаю с графикой,3D. Для остального хватает Минта. Кстати Блендер, заточенный под Линукс "из магазина" напрочь не хочет устанавливаться. Докопал до проблем с дровами и отчасти возможно с железом. Бросил по причине отсутствия времени. Все мои перлы тут обращены к среднему пользователю, чтобы люди не велись на кажущуюся простоту.А так, да, все можно настроить и запустить. С приветом.
#46 | 07:59 27.06.2019 | Кому: bezumkin
"Тотальное доминирование" есть только в вашей голове и серверных решениях.

Обычные же юзвери, сидят в своих вконтактиках из под виндовс.

В целом, вообще, Linux до сих пор настолько "юзер-фриендли", что шаг влево-шаг вправо от приложений, входящих в комплект текущей сборки используемой вами версии Linux - и привет, консоль, RTFM, зависимости, пакеты и прочее счастье.

Обычному пользователю, а не айтишнику, это счастье и даром не надо. Ему ехать надо, а не шашечки. Потому винда все еще и не мастдай.
#47 | 08:16 27.06.2019 | Кому: -Zlodey-
> входящих в комплект текущей сборки используемой вами версии Linux

"Остальное не нужно"
#48 | 08:52 27.06.2019 | Кому: Книга79
> У меня сейчас стоит МИНТ19 паралельно с Виндой.

Аналогично на ПК. На ноуте только Минт.

> Все мои перлы тут обращены к среднему пользователю, чтобы люди не велись на кажущуюся простоту.


Среднему пользователю не нужно ПО, про которое ты говоришь. Для среднего пользователя простота будет не кажущаяся.
#49 | 08:55 27.06.2019 | Кому: Книга79
> Затем, что будьте готовы: с ходу все ваши привычные программы не переедут на Линукс, а может и в принципе не переедут.

На работе я пользуюсь Линуксом, потому что привычных мне программ нет в Винде. И не будет никогда.
Если нужно специализированное ПО, то выбор ОС связан с ним, а не наоборот.

Для дома (интернет, почта, музыка, видео) среднему пользователю современного Линукса будет достаточно, если пользователь не играет в игрушки. Тогда Винда. Хотя и на Линуксе сейчас уже можно играть, но не во всё.

> Надо говотрить людям правду. Нюансов очень много, и о них скромно умалчивают.


Правду от людей никто не скрывает. О нюансах никто не умалчивает. С чего ты это вообще взял?
#50 | 08:59 27.06.2019 | Кому: -Zlodey-
> Обычные же юзвери, сидят в своих вконтактиках из под виндовс.

Обычные юзвери сидят в своих вконтактиках из под Android, который основан на Linux.
Войдите или зарегистрируйтесь чтобы писать комментарии.