Душа Питона
22.03.2025 05:05
Камеры в AirPods: что скрывается за новым функционалом Из музыкального девайса Apple превращает эйрподсы в AI-помощника по визуалу. “Уши” смогут "видеть" окружающий мир и помогут ориентироваться, даже не доставая смартфон из кармана Как это будет: можно спросить Siri про то, что видишь, повернув голову в нужную сторону насладиться объёмным звуком, который адаптируется под положение в пространстве интеграция с Visual Intelligence и системой Vision Pro Правда, ждать эту новинку придётся долго — примерно до 2027 года. Скорее всего, она появится только в AirPods Pro 4 Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Душа Питона
18.03.2025 14:53
Два Ernie против одной DeepSeek И немножко против GPT 4.5 Во-первых, Baidu показали нового Ernie X1, способного объяснять свои решения. Говорят, что он хорош в повседневных разговорах, сложных расчётах и логике. Во-вторых, обновили базового Ernie до версии 4.5, превосходящей такую же GPT в работе с текстом До кучи сделали все уровни сервиса включая X1 бесплатными для юзеров. Раньше запланированного срока Очень хотят не ударить в грязь лицом, очень Всё-таки Baidu — первые китайцы, выпустившие аналог ChatGPT, и им надо оправдывать доверие сообщества. Объявили даже, что с 30 июня полностью откроют Ernie Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Душа Питона
15.03.2025 05:01
Sony внедряет AI в игры: персонажи будут разговаривать с игроками Придумали классную вещь — героиню для PlayStation, управляемую AI. Речь идёт про Элой из игры Horizon. Проект делают вместе с Guerrilla Games. На сегодняшний день: Элой общается с геймерами через голосовые команды, используя умные штуки вроде синтезированной речи подключены OpenAI Whisper, GPT-4 и LLaMA 3 Sony применяет и собственные технологии — систему эмоциональной анимации EVS и генерации лица Mockingbird Всё это отлично тестится как на ПК, так и на PS5, работает на ура и не тратит много ресурсов Но надо понимать, что наша героиня ещё на стадии прототипа. Так что продолжаем следить за её развитием издалека продукт экстремистской организации, деятельность которой запрещена на территории РФ
Душа Питона
11.03.2025 10:54
Manus: китайский автономный гений Команда стартапа из Поднебесной выпустила AI-агента, по сравнению с которым модели OpenAI — малые дети В отличие от обычных чат-ботов: сам справляется с кучей дел в разных областях запоминает предпочтения пользователей и учится на ходу уже показал себя на платформах типа Upwork и Fiverr: перебрал резюме, изучил недвижимость и сделал финансовый анализ а ещё написал код на Python и даже развернул сайт Разрабы шокировали народ именно примерами работы помощника — аргументами, которых маловато у конкурентов. Ну и бенчи, конечно. Deep Research отдыхает в сторонке После анонса Manus китайские техгиганты, такие как Alibaba, Tencent и Baidu, резко взлетели в цене на бирже
Душа Питона
07.03.2025 11:10
Новые приключения AI: от колонок в СМИ до голосов в кино В LA Times AI теперь помечает статьи, где выражается личное мнение. Проставляет метку Voices. Работает, правда, пока неидеально, есть ошибки контролирующий его редактор, видимо, тоже расслабился Надеемся, что в пробном проекте Prime Video обойдётся без фейлов. Сервис запускает умное дублирование фильмов и сериалов Планируется, что AI будет делать черновик озвучки, а профи уже доведут его до ума. Пока технология задумана для английского и латиноамериканской версии испанского. У Amazon есть и ещё сюрпризы. Готовят новую AI-модель, которая должна уметь не только быстро отвечать, но и глубже разбираться в вопросах. Представят её под брендом Nova уже к июню Google вводит AI-наработки, чтобы прямо на смартфоне отслеживать разговоры и сразу же бить тревогу, если на связи мошенник Новое приложение для Android тут же выдаёт предупреждение: сигналит, вибрирует и показывает на экране, что разговор подозрительный.
Душа Питона
05.03.2025 12:07
4 новых AI-ассистента, облегчающих жизнь В Opera встроили Browser Operator для всякой рутины прямо на девайсе. Никто не получит доступ ни к логинам, ни к кукам, ни к истории просмотров Operator заходит куда надо, минуя лишние шаги, и работает со скрытыми элементами вроде всплывающих окон. Ассистент от Microsoft Dragon Copilot для медицины помогает врачам записывать консультации, вести документацию и справляться с массой разной бюрократии. Снижает риск выгорания у докторов и улучшает впечатление от лечения у пациентов Amazon прокачал наконец старушку Alexa, выпустив версию Alexa+. Она уже больше похожа на ChatGPT и Google Gemini. Учитывает личные предпочтения и лучше понимает контекст вопросов AI-помощником Tecno Ella в очках от Tecno AI Glasses и AI Glasses Pro можно управлять голосом и прикосновениями к дужке. Узнаёт предметы вокруг, пишет саммари текста, переводит на разные языки Изображение Zeno
Душа Питона
28.02.2025 11:29
GPT-4.5: умнее, креативнее, чувствительнее Новость так новость! OpenAI выпустили долгожданную версию своей языковой модели. По сравнению с GPT-4 и GPT-4o — самая мощная и довольно интересная Основное: много эмоций и креатива. GPT-4.5 общается более естественно, творчески подходит к задачам, лучше понимает намерения пользователя и меньше галлюцинирует планирует и решает намного круче — справляется с многоходовочками и автоматизацией мультимодальная — GPT-4.5 отлично работает с текстом и картинками, а в будущем обещают ещё поддержку аудио и видео Где взять? открыта для подписчиков ChatGPT Pro и скоро появится для Plus, Team, Enterprise и на Edu для разрабов доступна через API — это Chat Completions API, Assistants API и Batch API Чего пока нет и что нельзя делать? GPT-4.5 не дружит с голосом и видео, совместного использования экрана придётся подождать ещё одна важная деталь: модель требует больше ресурсов и стоит дороже Перед запуском провели кучу тестов на безопасность, так что всё чисто Изображение OpenAI
Душа Питона
15.02.2025 14:03
Goku ставит рекорды На пике популярности видео ByteDance выдали серию моделей Goku, использующих продвинутые трансформеры для одновременной генерации картинок и видео. Причём на уровне индустрии Детально проработали каждую мелочь: сбор данных: система фильтрует видео и фото по качеству, анализирует содержание с помощью OCR и проводит субъективные оценки дизайн: модели Goku доступны в версиях 2B и 8B rectified flow RF сжимает входные данные в единое пространство, это помогает лучше обучаться и генерить для масштабирования — настройка инфраструктуры с параллельными вычислениями и защитой от сбоев Результаты Goku: по картинкам — 0.76 на GenEval и 83.65 на DPG-Bench, по видео — 84.85 на VBench
Душа Питона
15.02.2025 04:58
Grok 3 vs все остальные Маск объявил, что Grok 3 почти готов к запуску и уже через неделю-две выйдет в свет В заявлении Илона на Всемирном правительственном саммите в Дубае было сказано: ⏳ Grok 3 находится на завершающей стадии новая версия круто справляется с задачами и показывает результаты лучше всех существующих аналогов намерение OpenAI полностью перейти на коммерческие рельсы — явный перебор Маск не был бы Маском, если бы в очередной раз не прошёлся по конкурентам. Но раз уж Grok 3 рвётся в бой, остаётся только ждать развязки Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Душа Питона
14.02.2025 14:34
Будь проще, и люди потянутся: планы OpenAI Сэм Альтман признал, что его разрабы немного перемудрили с моделями, поэтому надо делать продукты понятнее для народа. СЕО выступил с дорожной картой развития GPT-4.5 и GPT-5: GPT-4.5, которую внутри называли Orion, будет последней без chain-of-thought планируется объединить технологии серии “о” и GPT, чтобы создать систему, которая сама поймёт, где ей нужно думать, а где — необязательно в GPT-5 войдут разные инструменты OpenAI, включая o3, которой теперь не будет в качестве отдельной модели продвинутые функции ChatGPT запустят за дополнительную плату, в бесплатной версии будет доступ к базовому уровню, но безлимитный Точных сроков старта нет, но ждать осталось недолго — речь идёт о неделях/месяцах