FairScan 2.0: локальный OCR-сканер документов для Android с открытым кодом
Открытый Android-сканер FairScan дорос до версии 2.0 и наконец получил нормальное распознавание текста.
Илья Рябов, Обозреватель мобильного рынка и охотник за мелким шрифтом·обновлено 26 июня 2026 г.

Что нового в 2.0
Главное — добавили OCR на движке Tesseract. Теперь скан делает PDF с текстовым слоем, по которому можно искать. Для тех, кто хоть раз пытался найти в скане договора слово «штраф» или «неустойка», это не бонус, а базовая гигиена: обычная фотка PDF без текстового слоя превращается в картинку, в которой Ctrl+F не работает в принципе.
Сам Николя в техническом блоге объясняет, почему этой функции не было в первой версии (релиз 1.0 — сентябрь 2025): он принципиально не хотел выпускать OCR, который угадывает буквы через раз. Цитата прямая: «если документ трудно прочитать человеку, то его трудно прочитать и механизму OCR». Год ушёл на доводку обработки изображений, чтобы распознавание перестало выдавать ахинею вместо кириллицы.
Почему это интересно в нынешних раскладах
Приложение написано на Kotlin, исходники под лицензией GNU GPL v3.0, дистрибуция через Google Play, F-Droid и GitHub. То есть это не классическое «доверьте нам ваши паспорта, мы храним их в суперзащищённом облаке с шифрованием уровня „мы стараемся"», а прозрачный инструмент, в котором каждый шаг можно проверить самостоятельно.
Единственное, что может царапнуть глаз, — приложение запрашивает разрешение INTERNET. Николя честно предупреждает: оно нужно только для докачки дополнительных языковых пакетов OCR. Вся обработка документов идёт локально, на вашем устройстве, никуда ничего не утекает. На фоне новостей о том, как крупные магазины приложений одним движением вычищают из каталогов целые экосистемы сервисов, такой подход выглядит подозрительно честно — проверяйте сами, но по коду всё сходится.
Что проверить перед тем, как ставить
- Качайте из F-Droid или GitHub-релизов, если не доверяете Google Play — это тот же код, без сюрпризов.
- Не тащите все языковые пакеты скопом: каждый десяток мегабайт и плюс один шаг, на котором что-то может пойти не так. Берите только нужные языки.
- Не ждите от OCR чудес на мутных фотографиях при плохом свете. Движок опирается на ту же картинку, что и ваши глаза. Если текст на снимке еле различим — и поиск по PDF будет соответствующим. Лучше переснять.