Аватар автора

mtsai

tech

6581 Подписчиков
25 Сообщений
30 Показано сообщений
Не указана Дата добавления

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
Может ли ИИ заменить разработчиков? OpenAI проверили на реальных деньгах. OpenAI представили SWE-Lancer — новый бенчмарк, который оценивает не только код, а его реальный экономический эффект. Как проверяли: — взяли 1488 реальных задач с Upwork разной стоимости и сложности; — проверили, какие из них могут выполнить LLM; — посчитали, сколько денег “заработают” модели. Результаты: — Claude 3.5 Sonnet — $403 000; — o1 high compute — $380 000; — GPT-4o — $304 000. Пока ни одна модель не справляется с фриланс-задачами на уровне человека, но цифры впечатляют: LLM уже могут выполнять до 40% заказов. Следующий шаг — OpenAI планируют использовать SWE-Lancer не только для оценки возможностей ИИ, но и для анализа безопасности автономных AI-агентов в программировании. Читайте полное исследование Ваше мнение: когда ИИ догонит фриланс-разработчиков? Уже через пару лет Пока ИИ не понимает требования бизнеса — никогда
Открыть в Telegram → Открыть новость на сайте →
Аватар
Новые Gemini 2.0: мощнее, умнее, дешевле Google представила три новые модели Gemini 2.0 и запустила Flash Thinking — "думающую" нейросеть, аналог OpenAI o3 и DeepSeek-R1. Пока они поддерживают только текст, но в ближайшие месяцы компания обещает добавить изображения, аудио и видео в версии Flash и Pro. Что нового: Gemini 2.0 Flash — быстрая, производительная, дешевая модель в своем весе с контекстным окном до 1 млн токенов, теперь доступна всем желающим через приложение Gemini. Gemini 2.0 Flash-Lite — самый экономичный вариант для разработчиков, доступна через API. Gemini 2.0 Pro — мощная экспериментальная версия с контекстным окном 2 млн токенов в 2 раза больше, чем у Flash . По бенчмаркам Gemini 2.0 Pro обходит все прошлые версии: MATH – 91,8% лучший результат HiddenMath – 65,2% значительное улучшение SimpleQA – 44,3% против 29,9% у Flash и 30,1% у DeepSeek-R1 Интересно: Google снизила стоимость генерации контента для моделей Flash и Flash-Lite. Означает ли это, что нейросети станут доступнее, а цена на рассуждающие модели продолжит снижаться? Ваше мнение: Будущее за доступными моделями Цена упадёт, но топовые модели останутся дорогими Дешёвый ИИ — новые риски для безопасности
Открыть в Telegram → Открыть новость на сайте →
Аватар
Этот год для ИИ-агентов обещает быть жарким OpenAI представила Deep Research — ИИ-агента, который автономно проводит исследования и решает сложные задачи. Что важно знать: Работает на "рассуждающей" модели o3. Сочетает в себе возможности веб-браузинга, анализирует, прикрепленные файлы и выполняет Python-скриптов. В основе лежит принцип автономного планирования исследования — уточняет вопросы, отбирает источники. Обрабатывает сотни текстов, изображений и PDF-документов. Генерирует подробный отчет за 10–30 минут. В тесте Humanity’s Last Exam набирает 26,6% — в 12 раз лучше Grok-2 и GPT-4o. Доступен для пользователей ChatGPT Pro. Ваше мнение: Deep Research — это — шаг на пути к AGI — очередная надстройка для LLM
Открыть в Telegram → Открыть новость на сайте →
Аватар
Неделя апдейтов китайских моделей Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator. Модель способна: — анализировать сложные изображения с высокой точностью; — обрабатывать видео длительностью более 1 часа и выделять конкретные события в видео; — выдавать структурированные данные при работе с формами, таблицами, счетами; — лучше понимать последовательность событий и скорость на видео; — распознавать объекты, тексты, диаграммы, иконки и макеты на изображениях с помощью bounding-box или точек. Бенчмарки Qwen2.5-VL демонстрирует высокие результаты в анализе изображений, текста, а также событий на видео. При этом с интерпретацией графиков и формул справляется хуже западных конкурентов. Веса и модель #LLM_MTSAI
Открыть в Telegram → Открыть новость на сайте →
Аватар
Теперь выполнять рутинные задачи стало проще OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами. Что важно знать: — Operator работает на модели CUA Compute-Using Agent , основанной на ChatGPT-4o. — Хорошо справляется с поиском в интернете, однако может ошибиться при выполнении комплексных запросов, таких как создание расписания с нуля. — Действия агента можно корректировать и просить выполнить несколько задач одновременно. — Пока инструмент открыт только для пользователей в США с подпиской Pro. — OpenAI планируют открыть API, что позволит интегрировать решение в другие проекты. — Одним из первых Operator появится на eBay, где агент будет помогать пользователям с онлайн-покупками. Другие полезные ресурсы, связанные с Operator и автоматизацией задач, смотрите здесь.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Затопленный Диснейленд, папа римский в пуховике — вы тоже поверили? С развитием Gen AI в соцсетях всё чаще появляются изображения и видео, которые сложно отличить от реальных. Чтобы разоблачать такие дипфейки, MTS AI совместно с VisionLabs создали сервис, который выявляет поддельные изображения, видео или аудио. А также распознаёт запрещённый контент, включая сцены с алкоголем, оружием, наркотиками и экстремизмом. Ваше мнение: Где такой сервис будет наиболее полезен? — Для модерации контента в соцсетях и медиаплатформах — Для проверки безопасности в корпоративном секторе — Для борьбы с мошенничеством в телекоме MTS AI
Открыть в Telegram → Открыть новость на сайте →
Аватар
OpenAI представила Sora — новую ИИ-модель для генерации видео высокого качества. Она умеет: — Генерировать видео из текстового запроса всего за 20–120 секунд. — Создавать сториборды, объединяя несколько текстовых запросов в единую историю. — Добавлять эффекты, анимировать изображения и дорабатывать готовые видеоматериалы. ‍ Интерфейс модели отличается удобством — в нем есть встроенная галерея и система сохранений. Из минусов: модель пока доступна не всем, есть ограничения по генерации и строгая модерация. Запасаемся терпением, для удачного ролика потребуется не один десяток генераций и подписка Pro за $200 — она позволит создавать видео до 20 секунд, в максимальном разрешении, без водяных знаков. — Что ж, дадим модели шанс!
Открыть в Telegram → Открыть новость на сайте →
Аватар
Новое семейство genAI-моделей На конференции AWS re:Invent Amazon представила новое поколение нейросетей Amazon Nova, которое включает шесть моделей для работы с текстом, изображениями и видео. Компания позиционирует Nova как одну из самых быстрых и дешевых в использовании моделей в своем классе. Что входит в линейку: Micro: текстовая модель, работающая с минимальной задержкой Lite: мультимодальная модель для работы с текстом, изображениями и видео. Pro: усиленная версия Lite с оптимальным сочетанием точности и скорости ответов. Premier: объединяет все версии, предназначена для самых сложных задач и пока находится в доработке. Canvas: модель для генерации и редактирования изображений. Reel: модель для создания коротких видео до 6 секунд. Технические характеристики: Мультимодальность. Lite и Pro обрабатывают текст, изображения и видео. Длина контекста. Micro поддерживает до 128 тыс. токенов примерно 100 тыс. слов , Lite и Pro — до 300 тыс. около 225 тыс. слов или 30 минут видео . В 2025 году Amazon планирует увеличить этот объём до 2 млн токенов. Производительность. Pro сопоставима с Llama 3.2 90B. К посту прикрепили пример, как модель Canvas генерирует изображения. Все модели Nova, кроме Premier, доступны клиентам AWS. К 2025 году Amazon планирует запустить еще две модели: одну для голосового взаимодействия, другую — ориентированную на мультимодальные запросы и ответы. Как вам результат? — Пока сложно оценить, надо затестить — Гуд
Открыть в Telegram → Открыть новость на сайте →
Аватар
Первая рассуждающая модель от Alibaba Команда Qwen из Alibaba представила QwQ-32B — мощную открытую модель ИИ-модель, которая меняет подход к решению сложных задач и составляет серьёзную конкуренцию o1 от OpenAI и DeepSeek R1. Это первая «рассуждающая» опенсорс-модель с открытым доступом, которую можно запускать на локальных устройствах. Технические характеристики QwQ-32B: 32,5 млрд параметров обеспечивают высокую точность решений Обрабатывает запросы длиной до 32 тыс. токенов Показывает превосходные результаты на бенчмарках AIME и MATH, решая сложные логические и математические задачи Использует механизмы самопроверки, которые помогают снижать ошибки Доступ к модели можно получить через платформы: Hugging Face Демо Ваши прогнозы: — Alibaba задаст новый стандарт в ИИ — OpenAI останется впереди
Открыть в Telegram → Открыть новость на сайте →
Аватар
Искусственный интеллект постоянно расширяет сферы своего применения: от автоматизации рутинных задач до анализа коммуникации сотрудников. И финансовых сектор не исключение. В карусели собрали основные тренды и примеры ИИ-решений в этой нише. Напоминаем, что уже завтра, 17 сентября в 10:30 МСК на вебинаре «ИИ в финансовом секторе» мы рассмотрим лучшие кейсы от представителей крупнейших банков, а также стратегии от российских вендеров. Переходите по ссылке, чтобы занять место.
Открыть в Telegram → Открыть новость на сайте →