3 ноября, 00:03

Datalab представляет новую OCR модель Chandra для преобразования PDF и изображений в текст

Open Source
Open Source
Chandra Chandra это высокоточная OCR модель предназначенная для преобразования изображений и PDF документов в структурированные форматы такие как HTML Markdown и JSON сохраняя при этом их макет Она поддерживает множество языков обеспечивает точную реконструкцию форм обработку таблиц и сложных компоновок а также извлечение изображений с подписями Модель функционирует как в локальном так и в удаленном режимах предоставляя API и бесплатную тестовую платформу github com datalab to chandra News Soft Gear Links
Chandra новая OCR модель которая превращает PDF и изображения в текст Команда Datalab представила Chandra мощную модель распознавания текста которая превращает PDF сканы и картинки в удобные документы Что умеет Конвертирует файлы в HTML Markdown или JSON Корректно извлекает таблицы формулы и диаграммы Поддерживает более 40 языков В тестах обходит DeepSeek Mistral и другие OCR модели Работает прямо в браузере или ставится локально Полностью бесплатна Попробовать онлайн можно здесь а установить локально на GitHub
OMG GPT: Midjourney, DeepSeek, IT
OMG GPT: Midjourney, DeepSeek, IT
Chandra новая OCR модель которая превращает PDF и изображения в текст Команда Datalab представила Chandra мощную модель распознавания текста которая превращает PDF сканы и картинки в удобные документы Что умеет Конвертирует файлы в HTML Markdown или JSON Корректно извлекает таблицы формулы и диаграммы Поддерживает более 40 языков В тестах обходит DeepSeek Mistral и другие OCR модели Работает прямо в браузере или ставится локально Полностью бесплатна Попробовать онлайн можно здесь а установить локально на GitHub
Not Boring Tech
Not Boring Tech
Datalab выпустили лучшую OCR модель Chandra максимально точно извлекает всё содержимое из любых изображений и PDF документов Превращает фотки и файлы в структурированные форматы HTML Markdown и JSON Сохраняет макет и отлично вытаскивает таблицы формулы диаграммы и даже рукописный текст Поддерживает более 40 языков Возглавляет все независимые бенчмарки обгоняя DeepSeek OCR Mistral OCR и других конкурентов Модель Chandra доступна как локально так и удалённо GitHub здесь а бесплатная демка тут notboring tech
Эксплойт
Эксплойт
Превращаем любые PDF и картинки в обычные текстовые документы разрабы из Datalab выпустили лучшую OCR модель Chandra Просто закидываем файл и получаем вывод в формате HTML Markdown и JSON Легко вытаскивает таблицы формулы и диаграммы Понимает 40 языков В тестах обходит всех конкурентов DeepSeek Mistral и других Можно пользоваться в браузере или поставить локально Бесплатно Ставим локально с GitHub или пользуемся онлайн здесь exploitex
Не баг, а фича
Не баг, а фича
Datalab выкатили мощнейшую OCR модель Chandra она превращает любые PDF сканы и картинки в редактируемый текст Модель понимает 40 языков корректно вытаскивает таблицы формулы и даже диаграммы а в тестах обходит DeepSeek и Mistral Работает в браузере или локально и при этом полностью бесплатна Проверить можно тут bugfeature нейросеть