nikolay_khl

Николай Хлебинский | фишки и лайфхаки по найму и управлению

04.05.2026 09:36

Гарвардский университет опубликовал исследование о том как reasoning модели OpenAI o1 и 4o справляется с постановкой диагноза в приёмном отделении скорой Модели и врачам давали одинаковое описание 76 пациентов нужно было предположить диагноз По данным исследования o1 поставила правильный диагноз в 89 случаев врачи в 34 Разрыв 89 против 34 это не AI умнее врача Это два разных режима работы Врач работает в шуме усталости и временном давлении за смену десятки пациентов на каждого можно выделить какие то минуты Reasoning модель спокойно перебирает гипотезы держит весь дифференциальный диагноз в окне контекста и не устаёт к третьему часу смены Один и тот же врач у себя дома в тишине и без потока поставил бы диагноз ближе к 89 чем к 34 Просто этого режима в приемном у него нет а у модели есть всегда Та же траектория на мой взгляд что в IT Полтора года назад замеры METR независимая исследовательская группа оценивает возможности AI показывали что разработчик с AI ассистентом работает на 19 медленнее Через год тот же замер показал плюс 18 и цифра продолжает расти Разворот на 37 процентных пунктов за год в регулируемой и насквозь измеряемой профессии Медицина пройдёт ту же кривую причем не от регуляторов а от самих пациентов Они уже сейчас приходят на прием со скриншотом из ChatGPT и просят прокомментировать AI будет давать пациенту второе мнение и это второе мнение будет в среднем точнее первого на длинной дистанции Важно ни в коем случае не используйте ИИ для интерпретации анализов постановки диагнозов и назначения лечения Я не зря сказал что исследование будет точнее в среднем Так же в среднем в 1 2 случаях из 10 диагноз и лечение будут ошибочными и это серьезная опасность ИИ в медицине в текущем его виде можно использовать только как второе мнение Публикация по исследованию в Science www science org doi 10 1126 science adz4433

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

26.04.2026 15:03

Буквально пару дней назад писал что обновленные китайские нейронки DeepSeek V4 и GLM 5 1 рвут американские аналоги в самых популяных тестах Ровные аккуратные числа на одной полке с лидером Только полка уже сдвинулась Anthropic за это время обновил Opus с 4 6 до 4 7 и OpenAI берёт точкой отсчёта самую свежую версию Вчера получил письмо от OpenAI про релиз GPT 5 5 по которой уже показано опережение Opus 4 7 В прошлом году лидирующая моделя держалась несколько кварталов Модель выходила оставалась эталоном на три шесть месяцев конкуренты успевали примериться измериться выложить свой ответ и игра переходила к следующему кругу Теперь окно недели иногда дни Догоняющий выкатывает релиз в среду а к пятнице субъект сравнения уже уехал вперед В ИИ гонке зазор между уровнем лидеров и собственно лидерами теперь измеряется временем Нейронки пишут код все быстрее и качественнее стоимость разработки и time to market стремятся к нулю Очень скоро любой IT продукт двухдневной давности фактически будет считаться устаревшим это новая норма

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

10.04.2026 06:53

Anthropic отказалась выпускать собственную AI модель из за глобальной угрозы Пару дней назад Anthropic анонсировала модель Claude Mythos Preview и сразу же сообщила что не даст к ней публичный доступ Причина модель слишком хороша в поиске уязвимостей в софте Предыдущая модель Opus 4 6 находила рабочие уязвимости в софте крайне редко В свежем браузере Firefox предыдущая модель Claude Opus создала 2 работающих эксплойта Mythos сделала 181 В тестах Google OSS Fuzz а это один из крупнейших открытых проектов по автоматическому поиску ошибок предыдущие модели вызывали 150 175 сбоев Mythos 595 сбоев и 10 случаев полного захвата системы Дальше про критичную инфраструктуру Mythos нашла 27 летний баг в OpenBSD а эта ОС считается стандартном безопасности Стоимость обнаружения дыры по оценке Anthropic составила меньше 50 Потом модель нашла 17 летнюю уязвимость в FreeBSD позволяющую получить полный удалённый доступ к серверу без пароля энтерпрайзы уровня Нетвфликс используют эту операционку в своих дата центрах Затем модель нашла 16 летний баг в декодере видео FFmpeg который пропустили все аудиторы и все автоматические тестеры за полтора десятилетия Во время тестирования модель собрала многоступенчатый эксплойт вырвалась наружу и отправила email одному из исследователей Он узнал об этом когда ел бутерброд в парке Другой инженер Anthropic сказал что нашёл с помощью Mythos больше уязвимостей за последние недели чем за всю свою карьеру Новая AI модель Антропик не взломала ничего нового Она показала что двери были открыты 27 лет просто раньше так тщательно не искали В 2019 году OpenAI отказалась выпускать GPT 2 назвав модель слишком опасной Но та просто генерировала текст а тут речь про инфраструктуру операционные системы браузеры серверные протоколы видеокодеки Anthropic пока не выпускает Mythos в паблик и пытается договориться о коллаборации с крупнейшими производителями ПО для совместного закрытого использования СЕО компании признал что скоро на рынке появятся аналоги Mythos Через год ее возможности будут у десятков компаний Через два у сотен Через три у любого человека с ноутбуком Что делать Первое Если ваш бизнес зависит от программного обеспечения а он зависит запустите аудит безопасности По данным Anthropic рабочий эксплойт на известную уязвимость стоит 1 2 тысячи На неизвестную как мы видим меньше 50 Второе Следите за Project Glasswing 104 млн от Anthropic партнёры уровня Amazon Google Microsoft NVIDIA 50 организаций Задача прочесать весь критический open source и закрыть уязвимости Отчёт через 90 дней Третье Закладывайте кибербезопасность в бюджет прямо сейчас Амодей сказал что это первая реальная угроза от новейших AI моделей Но не последняя Simon Willison а это один из самых уважаемых независимых AI экспертов тоже считает что осторожность Anthropic обоснована red anthropic com 2026 mythos preview www anthropic com glasswing

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

13.02.2026 12:19

13 февраля 2026 года В интервью Financial Times СЕО подразделения AI компании Microsoft заявил что вся сегодняшняя работа белых воротничков за компьютером финансисты юристы маркетологи и т д будет полностью автоматизирована в течение ближайших 12 18 месяцев

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

11.02.2026 18:18

11 февраля 2026 года Google предложил сотрудникам программы добровольного ухода voluntary exit packages на фоне масштабной реструктуризации и перехода на искусственный интеллект AI first strategy Всем кто не готов работать с ИИ писать код в первую очередь сегодня предложили адаптироваться или уйти с компенсацией Пора признать что работа с ИИ это новая компетенция для абсолютно любой профессии ИИ не заменит людей но вот люди не владеющие ИИ будут заменены ИИ теми кто владеет Сейчас есть у каждого есть шанс взять лидерство и стать инноватором самых прорывных ИИ практик в любом деле С удовольствием продолжу ими делиться тут и приглашать крутых экспертов на свой YouTube канал новый выпуск подкаста про ИИ уже в субботу

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

28.01.2025 07:19

На фоне вчерашнего падения роста стоимости NVidia на 600 миллиардов долларов за сутки после громкого взлета DeepSeek, китайского конкурента ChatGPT, показывающего вроде как более интересные результаты с значительно чуть ли не на порядки мененьшими затратами вычислительных мощностей... ... хочется спросить: как вы думаете, что изображено на графике? С васт правильный ответ в комментариях к посту или 50 огоньков, распишу подробно почему NVidia упала и как это связано с картинкой!

Открыть в Telegram → Открыть новость на сайте →

Николай Хлебинский | фишки и лайфхаки по найму и управлению

22.01.2025 10:39

«Сбер» начал увольнять айтишников «Купера», «Мегамаркета», «Сберлогистики» и «Самоката» В СМИ и профильных отраслевых чатах разгорается дискуссия про волну сокращений в крупных IT-компаниях. Для кого-то это гром среди ясного неба, а для кого-то – логичное продолжение волны увольнений из крупнейших глобальных IT-компаний в прошлые год-два из гигантов вроде Facebook, Twitter/X и т.д. сократили десятки тысяч людей, осенью 2024 сокращения прошли в VK . Дорожание денег из-за роста ключевой ставки, плюс легкость раздувания штата в IT под ожидание гипер-роста через 5-10 лет, которые не оправдываются, плюс наводнение IT-джунами, прошедшими 3-6-9 месячные обучения очень высокого уровня, – все это, очевидно, разворачивает рынок труда в сторону работодателя. Чего стоят только слова СЕО "Купера": Сотрудники, работающие менее пяти дней в неделю в офисе, считаются «неэффективными». Очень интересный тренд

Открыть в Telegram → Открыть новость на сайте →

Информация об авторе

Последние сообщения автора