Datalab представляет новую OCR модель Chandra для преобразования PDF и изображений в текст

Chandra Chandra это высокоточная OCR модель предназначенная для преобразования изображений и PDF документов в структурированные форматы такие как HTML Markdown и JSON сохраняя при этом их макет Она поддерживает множество языков обеспечивает точную реконструкцию форм обработку таблиц и сложных компоновок а также извлечение изображений с подписями Модель функционирует как в локальном так и в удаленном режимах предоставляя API и бесплатную тестовую платформу github com datalab to chandra News Soft Gear Links

Технологии189 дней назад

Chandra новая OCR модель которая превращает PDF и изображения в текст Команда Datalab представила Chandra мощную модель распознавания текста которая превращает PDF сканы и картинки в удобные документы Что умеет Конвертирует файлы в HTML Markdown или JSON Корректно извлекает таблицы формулы и диаграммы Поддерживает более 40 языков В тестах обходит DeepSeek Mistral и другие OCR модели Работает прямо в браузере или ставится локально Полностью бесплатна Попробовать онлайн можно здесь а установить локально на GitHub

OMG GPT: Midjourney, DeepSeek, IT

Chandra новая OCR модель которая превращает PDF и изображения в текст Команда Datalab представила Chandra мощную модель распознавания текста которая превращает PDF сканы и картинки в удобные документы Что умеет Конвертирует файлы в HTML Markdown или JSON Корректно извлекает таблицы формулы и диаграммы Поддерживает более 40 языков В тестах обходит DeepSeek Mistral и другие OCR модели Работает прямо в браузере или ставится локально Полностью бесплатна Попробовать онлайн можно здесь а установить локально на GitHub

Технологии188 дней назад

Not Boring Tech

Datalab выпустили лучшую OCR модель Chandra максимально точно извлекает всё содержимое из любых изображений и PDF документов Превращает фотки и файлы в структурированные форматы HTML Markdown и JSON Сохраняет макет и отлично вытаскивает таблицы формулы диаграммы и даже рукописный текст Поддерживает более 40 языков Возглавляет все независимые бенчмарки обгоняя DeepSeek OCR Mistral OCR и других конкурентов Модель Chandra доступна как локально так и удалённо GitHub здесь а бесплатная демка тут notboring tech

Технологии189 дней назад

Эксплойт

Превращаем любые PDF и картинки в обычные текстовые документы разрабы из Datalab выпустили лучшую OCR модель Chandra Просто закидываем файл и получаем вывод в формате HTML Markdown и JSON Легко вытаскивает таблицы формулы и диаграммы Понимает 40 языков В тестах обходит всех конкурентов DeepSeek Mistral и других Можно пользоваться в браузере или поставить локально Бесплатно Ставим локально с GitHub или пользуемся онлайн здесь exploitex

Технологии189 дней назад

Не баг, а фича

Datalab выкатили мощнейшую OCR модель Chandra она превращает любые PDF сканы и картинки в редактируемый текст Модель понимает 40 языков корректно вытаскивает таблицы формулы и даже диаграммы а в тестах обходит DeepSeek и Mistral Работает в браузере или локально и при этом полностью бесплатна Проверить можно тут bugfeature нейросеть

Технологии185 дней назад

Datalab представляет новую OCR модель Chandra для преобразования PDF и изображений в текст

Источники

Запуск Lazyweb: новый инструмент для дизайнеров и вайбкодеров

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют

Мощная солнечная вспышка ожидает геомагнитные бури на Земле

Александра Пахмутова делится кадрами инсталляции Свет Великой Победы в Волгограде

Элиста принимает Дни индийской культуры с уникальной песчаной скульптурой Будды

Павел Дуров поддерживает Илона Маска и X в борьбе с французским расследованием