Articles of ocr

Как тренировать tesseract для распознавания только 20 – 30 цифр?

Я использую tess-two Tesseract Android Tools для своего проекта. Из исследования, которое я сделал, я нашел здесь способ ограничить типы символов, но не диапазон символов. В библиотеке Tess-Two, которую я использую, нет файла tessdata / config, поэтому как я могу ограничить возможные символы, распознаваемые tesseract? Как я могу ограничить Tesseract распознать диапазон цифр (от 20 […]

SDK Google Диска – Загрузка изображения, OCR, Загрузка результата

Так что в конечном итоге я пытаюсь загрузить изображения, которые я хочу, чтобы Google был OCR. Затем я хочу, чтобы результаты OCR вернулись к моему Android-приложению. У меня загружены мои изображения правильно. Я могу перебрать все файлы на моем диске Google, и я вижу, что есть доступные ссылки для экспорта, один из которых – «текст […]

Создание оптимизированной / подходящей для OCR активности камеры

Я пытаюсь создать активность камеры для съемки фотографий OCR'd. Вот что я хочу сделать: Измененный размер окна в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровое изображение и обработана движком OCR. Непрерывная автофокусировка (сделано) Я использую tesseract btw. Если кто-то захочет указать мне на некоторые ссылки / примеры / учебники, […]

Использование regex и android для классификации разных полей

В настоящее время я пытаюсь сделать приложение для сканирования визитных карточек. Идея здесь заключается в том, чтобы сфотографировать карточку имени и извлечь текст и классифицировать текст в другой EditText. Я уже завершил часть OCR, которая извлекает весь текст из образа карты имени. Теперь мне не хватает метода regex, который может извлечь весь текст из OCR […]

Сканировать изображение и взять текст с него

Я видел некоторые приложения, которые сканируют изображение и возвращают текст. Есть ли библиотека для этого или нет? Я имею в виду либо сканирование текста, либо его изображение и идентификацию символов? Я искал OCR, но я не нашел материал, чтобы читать. ты можешь помочь мне с этим?

Tesseract OCR Android tessdata каталог не найден

В настоящее время я разрабатываю приложение для Android с использованием OCR, и я достиг точки, где я вызываю метод BaseAPI.init (). Я продолжаю получать ошибки, заявляя, что каталог должен содержать tessdata в качестве подпапки. Я проверил, что каталог файлов содержит папку с файлом trainingdata внутри, и убедитесь, что я указываю на правильный каталог. Я бы […]

Приложение OCR для Android, использующее Tesseract

Я пытаюсь создать приложение OCR на Android с помощью Tesseract, но когда я сохраняю изображение, приложение подавляет. Я создал сборку фотографий с помощью учебника « Простая фотосъемка Android» и функция OCR с помощью руководства « Создание простого приложения OCR для Android с помощью Tesseract» . Это код, который я использую: package com.mmm.pitter; import java.io.File; import […]

Как использовать OpenCV + Tesseract для точного распознавания текста в Android?

Я пытаюсь использовать OpenCV (Android) для обработки изображения, сделанного с помощью камеры, а затем передать его Tesseract для распознавания текста (цифр), но я не получаю хороших результатов, пока изображения не будут (почти без шума) прекрасными. В настоящее время я выполняю обработку на обработанных изображениях следующим образом: 1. Применение размытия Gaussian. 2. Адаптивный порог: для бинаризации […]

Leptonica для усиления tesseract ocr в андроиде

Я работаю над проектом OCR для Android и решил использовать tesseract, но у меня очень плохие результаты. Я обнаружил, что у leptonica есть довольно хорошие функции, которые могут помочь улучшить результаты, но я не могу найти какой-либо пример или документацию о том, как использовать его в android, только есть документация cpp api, может ли кто-нибудь […]

Приложение для Android OCR: словарь Tesseract

Я разрабатываю приложение для Android, которое берет фотографию и преобразует ее в текст. Я использую tesseract 3 на окнах. Мне удалось заставить большую часть перевода работать правильно (после выполнения масштабирования, бинаризации, улучшения), но какой-то символ все еще не переведен так, как должен (ri -> m, le -> Ie и т. Д.). Чтобы исправить это, я […]