15 июня, 10:47
Китайская компания ByteDance представила нейронную сеть Dolphin для преобразования PDF в текст

Нейродвиж
Китайцы выпустили нейронку, которая превращает любой PDF в обычный документ — ИИ бережно перенесёт таблицы, картинки и текст, не ломая форматирование. Под капотом у модели Dolphin мощные инструменты, которые сканируют ваш документ, сортируют таблицы и картинки, а потом собирают всё вместе. Сам проект на GitHub, есть бесплатная онлайн-демка.
Технологии57 дней назад

Техничка
Dolphin от ByteDance спасает ваши PDF ByteDance выпустили нейросеть Dolphin, которая превращает любые PDF в структурированные документы, сохраняя всё как в оригинале. Что умеет: - Сохраняет подписи, графики и таблицы без искажений - Парсит текст и визуал одновременно — быстро и чётко - Лёгкая архитектура, не грузит ваш ПК Теперь PDF больше не тупик, пробуем тут. Техничка
Технологии57 дней назад

Not Boring Tech
ByteDance дропнули самую точную OCR-модель для распознавания любых PDF — Dolphin превращает в оформленный текст фотки документов, сканы отчётов и даже научные статьи. Нейронка сохраняет форматирование и вытаскивает содержимое — абзацы, таблицы, диаграммы, рисунки и формулы. Можно точечно парсить даже отдельные элементы например, таблицы . GitHub лежит тут, демка — тут.
Технологии57 дней назад

let media
PDF без боли — ByteDance выпустили нейросеть для конверта Новый инструмент Dolphin от ByteDance аккуратно превращает любые PDF в нормальные документы — не ломая кодировки, сохраняя все подписи и картинки. Пробуем здесь. media
Технологии57 дней назад

Русский ИТ бизнес 👨
Dolphin - новый проект от ByteDance для разбора сложных документов с картинками, текстами, таблицами и формулами. Он работает в два этапа: сначала анализирует структуру страницы, потом параллельно обрабатывает элементы. Модель вышла в мае 2025, а 13 июня добавили разбор многостраничных PDF. Код открытый, уже 1.7к звезд на GitHub, и он поддерживает Hugging Face для удобной интеграции. Есть демо, чтобы попробовать, и pretrained-модели, которые можно скачать. Вообщем если нужен парсер документов, это стоит попробовать, но будьте готовы к возможным багам : Не уверен на качественную поддержку русского языка. Русский ИТ бизнес
Технологии54 дня назад
Похожие новости



+13



+8



+16



+5



+2



+2

Поддержка семей участников СВО: новые меры в Камчатском крае и сертификаты на материнский капитал в Республике Алтай
Происшествия
1 день назад




Уязвимость ChatGPT: конфиденциальные данные под угрозой из-за вредоносных промптов
Технологии
1 день назад




Пятеро мигрантов использовали биотуалет для незаконного пересечения границы Польши
Происшествия
2 часа назад




Новые технологии в смартфонах и SSD: 200 Мп камеры и PCIe 6.0 контроллер
Технологии
1 день назад




Microsoft завершает поддержку приложения Lens, рекомендуя перейти на Microsoft 365 Copilot
Технологии
11 часов назад




В Екатеринбурге создается столовая для работников ДЭУ по инициативе главы района
Общество
1 день назад


