Содержание
ИИ продолжает развиваться с головокружительной скоростью, и на этой неделе будет сделано множество интересных анонсов, особенно с учетом того, что центральное место займет выставка CES 2025. От анонсов аппаратного обеспечения Nvidia до мыслей Сэма Альтмана об AGI — здесь есть что раскрыть. Позвольте мне упростить для вас — вот все интересное и новое в области искусственного интеллекта на этой неделе.
Обязательно к прочтению: Вы просмотрели наши последние Неделя в ИИ ? Обязательно прочтите, чтобы быть в курсе того, что произошло на прошлой неделе.
Nvidia представляет графические процессоры серии RTX 50
Nvidia привлекла к себе внимание на выставке CES в этом году, сделав ряд важных анонсов, включая долгожданный Графические процессоры серии RTX 50 . Эти графические процессоры, построенные на новой архитектуре Nvidia Blackwell, созданы для удовлетворения потребностей геймеров, видеоредакторов и особенно энтузиастов искусственного интеллекта. Обладая вдвое большей производительностью по сравнению с предыдущим поколением, они могут локально запускать множество генеративных моделей искусственного интеллекта.
В линейке четыре графических процессора: RTX 5070, RTX 5070 Ti, RTX 5080 и RTX 5090. Отличительной чертой линейки является RTX 5070, бюджетное предложение Nvidia. Он обеспечивает производительность, сравнимую с прошлогодней топовой RTX 4090, всего за 549 долларов — примерно треть цены RTX 4090.
Nvidia представляет DIGITS, персональный суперкомпьютер с искусственным интеллектом
Еще одно объявление от Nvidia — новый суперкомпьютер с искусственным интеллектом под названием DIGITS . Представьте себе устройство размером с Mac mini, способное запускать модели искусственного интеллекта с числом до 200 миллиардов параметров, но доступное таким конечным пользователям, как мы с вами. В его основе лежит суперчип Grace Blackwell от Nvidia в сочетании с 128 ГБ памяти и 4 ТБ твердотельного накопителя NVMe.
По сути, это похоже на наличие на вашем столе сервера искусственного интеллекта, предназначенного для локального запуска или создания моделей искусственного интеллекта. DIGITS работает на ОС Nvidia DGX, системе, основанной на Ubuntu Linux с открытым исходным кодом, и поддерживает инструменты искусственного интеллекта Nvidia, а также популярные платформы искусственного интеллекта. Ожидается, что он поступит в продажу по цене 3000 долларов США в мае 2025 года.
DeepMind разрабатывает симуляционные модели мира для обучения искусственному интеллекту
DeepMind работает над моделями искусственного интеллекта, имитирующими реальную среду. Они идеально подходят для обучения роботов и автономных систем без необходимости использования реальных данных. Представьте себе, что вы тестируете беспилотный автомобиль в заснеженной местности или оптимизируете планировку завода — и все это в виртуальном пространстве. Эта технология ускоряет разработку искусственного интеллекта, одновременно сокращая затраты и делая конечный продукт более доступным.
Google представляет функцию ежедневного прослушивания персонализированных подкастов, созданных искусственным интеллектом
Новый Функция ежедневного прослушивания от Google превращает вашу страницу Google Discover в персонализированный подкаст, созданный искусственным интеллектом. Думайте об этом как о своем собственном ежедневном обновлении новостей в форме подкаста. Эта функция скоро будет доступна в Google Discover.
Как и Google БлокнотLM , подкаст включает в себя два хоста AI. Эта функция внедряется постепенно, поэтому следите за ней.
Модель Microsoft с открытым исходным кодом Phi 4
Phi 4 – это модель искусственного интеллекта Microsoft. Теперь он имеет открытый исходный код и доступен на Hugging Face. Он создан для таких задач, как математика, многоязычное решение задач и генерация функционального кода. Он содержит всего 14 миллиардов параметров. Он легкий, но мощный, что делает его отличным вариантом для разработчиков и пользователей, желающих запускать небольшие модели искусственного интеллекта локально или интегрировать их в свои приложения.
XAI выпускает Grok как отдельное приложение для iPhone
Grok, чат-бот с искусственным интеллектом из xAI Илона Маска, теперь имеет приложение для iPhone в США. Раньше Grok был доступен только через веб-сайт или приложение X (ранее Твиттер) .
Хотя новое приложение простое и урезанное, оно обещает меньшую цензуру по сравнению с другими чат-ботами с искусственным интеллектом. Хотите ли вы пообщаться или создать креативный контент, попробуйте Grok, поэтому стоит попробовать.
Сэм Альтман обрисовывает планы по AGI и ASI
Генеральный директор OpenAI, Сэм Альтман объявил , они уверены в достижении AGI (общего искусственного интеллекта) и теперь стремятся к ASI (искусственному сверхинтеллекту). AGI относится к ИИ, столь же умному, как и люди, тогда как ASI выходит за рамки человеческого интеллекта. По мнению Альтмана, мы сможем увидеть, как агенты искусственного интеллекта изменят рабочие места уже в 2025 году. Слишком рано для человечества?
Gaze-LLE отслеживает фокусировку глаз в видео и изображениях
Этот инструмент искусственного интеллекта предсказывает, куда кто-то смотрит на изображении или видео. Например, вы можете загрузить видео, и оно покажет, куда смотрит каждый человек в видео. ИИ создает тепловые карты, чтобы выделить области внимания, что позволяет анализировать внимание в режиме реального времени.
ВЗГЛЯД LLE — это модель с открытым исходным кодом, поэтому вы можете загрузить ее для локального запуска или использовать на таких платформах, как Hugging Face и Google Colab. Это полезно для наблюдения, исследований и интерактивного взаимодействия.
Stereocrafter конвертирует 2D-видео в 3D
Эта новая модель искусственного интеллекта позволяет с легкостью преобразовывать 2D-видео в 3D. Обычно для создания 3D-эффекта художник по визуальным эффектам вручную отделяет каждый слой для придания глубины. Однако эта модель автоматизирует весь процесс. После конвертации вы сможете смотреть видео в классических красно-зеленых 3D-очках.
Однако на этом дело не заканчивается. Стереокрафтер также может создавать видео, совместимые с гарнитурами виртуальной реальности, такими как Apple Vision Pro. Он использует ваши входные данные в качестве левого изображения и генерирует соответствующее правое представление, создавая захватывающий опыт виртуальной реальности. Это модель с открытым исходным кодом, доступная на GitHub.
Razer представляет Project Ava, систему искусственного интеллекта для геймеров
Razer Project Ava — игровой помощник на базе искусственного интеллекта создан для того, чтобы вывести ваши игровые навыки на новый уровень. Этот инструмент анализирует ваш игровой процесс в режиме реального времени, выявляя схемы атак, выявляя ошибки и предлагая более разумные стратегии. В игровом сообществе мнения по этому вопросу разделились: некоторые считают, что это похоже на мошенничество, отнимающее у геймеров, которые для победы полагаются на опыт, навыки и стратегию.
Независимо от того, сражаетесь ли вы с крутым боссом или разрабатываете стратегию конкурентной многопользовательской игры, Ава вас поддержит. После завершения игры система генерирует подробные отчеты после игры, включая статистику, повторы критических моментов и персональные советы, которые помогут вам улучшить игру. Думайте о нем как о профессиональном тренере, который всегда рядом с вами и готов помочь вам повысить свой уровень в каждом матче.
Spar3D от Stability AI генерирует 3D-модели из отдельных изображений
Спар3D поможет создавать или, скорее, генерировать 3D-модели. Этот инструмент на базе искусственного интеллекта позволяет создавать 3D-модель всего из одного изображения менее чем за секунду. Он утверждает, что создает точные, подробные 3D-представления для AR, VR, игрового дизайна и анимации, используя передовые методы построения облаков точек и сеток.
Spar3D также поддерживает редактирование в реальном времени — вы можете настраивать модели, менять цвета и форму объектов на лету. Он быстрый и доступный, что делает его подходящим для дизайнеров и разработчиков, желающих сэкономить время.
VLC представляет субтитры и переводы, созданные с помощью искусственного интеллекта
В этом году на выставке CES компания VLC представила новую функцию искусственного интеллекта, которая обеспечивает субтитры и переводы видео в реальном времени на более чем 100 языков. Лучшая часть? Он работает полностью в автономном режиме, то есть подключение к Интернету не требуется. Это не только обеспечивает более быструю обработку, но и защищает вашу конфиденциальность. Подробности о том, когда эта функция будет доступна, не будут доступны.
Adobe позволяет создавать прозрачное видео
Новая функция искусственного интеллекта Adobe позволяет пользователям создавать видео с прозрачным фоном. Вы можете использовать его для создания анимации зеленого экрана, графики и специальных эффектов для существующих материалов. Например, вы можете создавать эффекты дыма, взрывов, освещения и наложения погоды. Это должно сделать редактирование видео проще и быстрее.
Video Anydoor позволяет пользователям редактировать, заменять и добавлять объекты в видео
Видео в любом помещении — это передовой инструмент искусственного интеллекта, который позволяет легко добавлять, заменять объекты в видео или манипулировать ими. Несколько примеров, где вы можете его использовать, — это замена лица, добавление логотипов и естественная вставка совершенно новых объектов. Он автоматически настраивает освещение, тени и цвета в соответствии с окружающей средой исходного видео. Например, вы можете добавить бабочку в клип природы или поменять одежду персонажа в сцене фильма, и конечный результат должен слиться. Это может быть ценным инструментом для кинематографистов, рекламодателей и создателей контента.
ИИ Hailuo обеспечивает единообразие персонажей видео в разных сценах
Одна из основных проблем большинства моделей создания видео с помощью искусственного интеллекта заключается в том, что они часто создают видеоролики с непоследовательными персонажами. Но что, если вы хотите, чтобы во всех ваших видео был один и тот же персонаж? В справочнике по теме видеогенератора Hailuo говорится, что теперь вы можете загрузить изображение персонажа, ввести подсказку, и в сгенерированном видео будет постоянно присутствовать выбранный вами персонаж.
Эта функция работает с реальными человеческими лицами, анимацией, мультфильмами и даже мордами животных. Функция «Справочник по теме» уже доступна, и вы можете проверить ее на Сайт Хайлуо .
Медицинский чат-бот Movano EvieAI заявляет о точности 99 %
EvieAI — это медицинский чат-бот , который утверждает, что дает 99% точных ответов без галлюцинаций и догадок. Основанный на 10 000 медицинских журналах из надежных источников, таких как клиника Мэйо, он обещает надежность и точность.
Если у чат-бота нет необходимой вам информации, он просто говорит: «Я не знаю» вместо того, чтобы давать случайный или неточный ответ. В настоящее время EvieAI доступен в бета-версии и бесплатен для пользователей Evie Ring через сопутствующее приложение.
Умное зеркало Omnia AI следит за вашим здоровьем
Омния компании Withings, представленная на выставке CES 2025, представляет собой интеллектуальное зеркало, призванное сделать мониторинг здоровья частью вашей повседневной жизни. Он сканирует ваше тело, чтобы измерить такие показатели здоровья, как вес, здоровье сердца и состав тела. Используя искусственный интеллект, он предоставляет обратную связь в режиме реального времени и персонализированную информацию, которая поможет вам не сбиться с пути в достижении ваших целей в отношении здоровья.
Пылесос Saros Z70 от Roborock оснащен роботизированной рукой
Saros Z70 от Roborock — это умный робот-пылесос с особенностью: он оснащен пятиосным рычагом OmniGrip. Эта рука может собирать такие предметы, как носки, игрушки и мелкие предметы (до 300 граммов), которые обычно блокируют обычный пылесос. Предварительная расчистка пути обеспечивает более качественную и бесперебойную уборку. Z70 использует усовершенствованный искусственный интеллект и датчики для навигации по дому и управления рукой, чтобы подбирать вещи.
Mudra Link переносит жесты рук на устройства виртуальной реальности
Mudra Link, представленный на выставке CES 2025, — это браслет, позволяющий управлять устройствами с помощью простых жестов. Он распознает едва заметные движения пальцев и запястий и преобразует их в команды для вашего смартфона, компьютера и гарнитур AR/VR.
Представьте, что вы играете в VR-игры без контроллеров и только с помощью рук. Браслет был отмечен на выставке CES в категории XR Technologies за инновационный дизайн.
Вышел фильм с дипфейком Путина
Новый английский фильм «Путин» о жизни Владимира Путина только что появился в кинотеатрах на этой неделе. Но вместо того, чтобы использовать тяжелый грим или обычные визуальные эффекты, он использует передовой искусственный интеллект и технологию дипфейков, чтобы перенести лицо Путина на польского актера Славомира Собалу, который потратил два года на изучение языка тела и манер Путина, чтобы улучшить изображение.
Хотя технология впечатляет, она снова поднимает этические вопросы об использовании ИИ в повествовании. Фильм вышел 10 января 2025 года в нескольких странах, включая США и Украину, но в России он не выйдет.
Итак, что вы прочитали об искусственном интеллекте на этой неделе? Дайте нам знать на X.