3 ноября, 00:03
Datalab представляет новую OCR модель Chandra для преобразования PDF и изображений в текст

Open Source
Chandra Chandra это высокоточная OCR модель предназначенная для преобразования изображений и PDF документов в структурированные форматы такие как HTML Markdown и JSON сохраняя при этом их макет Она поддерживает множество языков обеспечивает точную реконструкцию форм обработку таблиц и сложных компоновок а также извлечение изображений с подписями Модель функционирует как в локальном так и в удаленном режимах предоставляя API и бесплатную тестовую платформу github com datalab to chandra News Soft Gear Links
Технологии1 день назад

Not Boring Tech
Datalab выпустили лучшую OCR модель Chandra максимально точно извлекает всё содержимое из любых изображений и PDF документов Превращает фотки и файлы в структурированные форматы HTML Markdown и JSON Сохраняет макет и отлично вытаскивает таблицы формулы диаграммы и даже рукописный текст Поддерживает более 40 языков Возглавляет все независимые бенчмарки обгоняя DeepSeek OCR Mistral OCR и других конкурентов Модель Chandra доступна как локально так и удалённо GitHub здесь а бесплатная демка тут notboring tech
Технологии9 часов назад

Эксплойт
Превращаем любые PDF и картинки в обычные текстовые документы разрабы из Datalab выпустили лучшую OCR модель Chandra Просто закидываем файл и получаем вывод в формате HTML Markdown и JSON Легко вытаскивает таблицы формулы и диаграммы Понимает 40 языков В тестах обходит всех конкурентов DeepSeek Mistral и других Можно пользоваться в браузере или поставить локально Бесплатно Ставим локально с GitHub или пользуемся онлайн здесь exploitex
Технологии8 часов назад
Похожие новости







+80






+2



+4



Китайские гуманоиды поступили в продажу на Ozon за 3,4 млн рублей
Технологии
14 часов назад



OpenAI обновляет правила использования ChatGPT, ограничивая медицинские и юридические советы
Технологии
1 день назад


+80
Москва увеличивает закупки оргтехники в три раза в 2025 году
Политика
1 день назад


ВТБ Онлайн улучшает умную камеру для распознавания банковских данных
Технологии
1 день назад


+2
Генеративный ИИ и цифровизация могут увеличить прибыль российского ритейла до 160 млрд рублей к 2030 году
Технологии
1 день назад


+4
Обзор платформ для удаленной работы: находите мини-проекты без офисов
Происшествия
19 часов назад
