OpenNET: Новости

/ Для программиста / Машинное обучение, AI
·	02.04.2024	Databricks открыл большую языковую модель DBRX, опережающую в тестах GPT-3.5 (62 +15)
	Компания Databricks объявила об открытии большой языковой модели DBRX, которая может применяться для создания чат-ботов, отвечающих на вопросы на естественном языке, решающих предложенные математические задачи, способных генерировать контент на заданную тему и создавать код на различных языках программирования. Модель разработана компанией Mosaic ML, которая была куплена Databricks за 1.3 млрд долларов. Для обучения использовался кластер из 3072 GPU NVIDIA H100 Tensor Core. Для запуска готовой модели рекомендуется 320GB памяти... (62 +15) обсуждение \| весь текст

·	18.03.2024	Компания xAI, созданная Илоном Маском, открыла большую языковую модель Grok (111 +22)
	Компания xAI, основанная Илоном Маском и получившая около миллиарда долларов на развитие технологий, связанных с искусственным интеллектом, объявила об открытии большой языковой модели Grok, применяемой в чатботе, интегрированном в социальную сеть X (Twitter). Набор весовых коэффициентов, архитектура нейронной сети и примеры использования опубликованы под лицензией Apache 2.0. Для загрузки доступен готовый к применению архив с моделью, размером 296 ГБ (magnet)... (111 +22) обсуждение \| весь текст

·	12.03.2024	Проект OpenAI открыл Transformer Debugger, отладчик для моделей машинного обучения (36 +6)
	Проект OpenAI, занимающийся развитием общедоступных проектов в области искусственного интеллекта, опубликовал отладчик Transformer Debugger, предназначенный для анализа активации структур в языковых моделях машинного обучения при обработке тех или иных данных. Как и в традиционных отладчиках в Transformer Debugger поддерживает пошаговую навигацию по выводу моделей, трассировку и перехват определённой активности. В общем виде Transformer Debugger позволяет разобраться почему языковая модель в ответ на определённый запрос выводит один токен вместо другого или почему модель уделяет большее внимание определённым токенам в запросе. Код написан на языке Python и распространяется под лицензией MIT... (36 +6) обсуждение \| весь текст

·	03.03.2024	ArtPrompt - атака на AI-системы, позволяющая обойти фильтры при помощи ASCII-картинок (109 +20)
	Группа исследователей из Вашингтонского, Иллинойсского и Чикагского университетов выявила новый метод обхода ограничений по обработке опасного контента в AI-чатоботах, построенных на основе больших языковых моделей (LLM). Атака основана на том, что языковые модели GPT-3.5, GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic) и Llama2 (Meta) успешно распознают и учитывают в запросах текст, оформленный в виде ASCII-графики. Таким образом, для обхода фильтров опасных вопросов оказалось достаточно указать запрещённые слова в виде ASCII-картинки... (109 +20) обсуждение \| весь текст

·	29.02.2024	В репозитории Hugging Face выявлены вредоносные AI-модели, выполняющие код (47 +9)
	Исследователи из компании JFrog выявили в репозитории Hugging Face вредоносные модели машинного обучения, установка которых может привести к выполнению кода атакующего для получения контроля над системой пользователя. Проблема вызвана тем, что некоторые форматы распространения моделей допускают встраивание исполняемого кода, например, модели, использующие формат "pickle", могут включать сериализированные объекты на языке Python, а также код, выполняемый при загрузке файла, а модели Tensorflow Keras могут исполнять код через Lambda Layer... (47 +9) обсуждение \| весь текст

·	23.02.2024	Google открыл AI-модель Gemma, основанную на технологиях, общих с чат-ботом Gemini (54 +9)
	Компания Google объявила о публикации большой языковой модели машинного обучения Gemma, построенной с использованием технологий, применяемых для построения модели чат-бота Gemini, пытающегося конкурировать с ChatGPT. Модель доступна в четырёх вариантах, охватывающих 2 и 7 миллиардов параметров, в базовом и оптимизированном для диалоговых систем представлениях. Варианты с 2 млрд параметров подходят для использования в потребительских приложениях и для их обработки достаточно CPU. Варианты с 7 млрд параметров требуют более мощного оборудования и наличия GPU или TPU... (54 +9) обсуждение \| весь текст

·	08.02.2024	Выпуск Savant 0.2.7, фреймворка компьютерного зрения и глубокого обучения (3 +7)
	Опубликован выпуск Python-фреймворка Savant 0.2.7, упрощающего использование NVIDIA DeepStream для решения задач, связанных с машинным обучением. Фреймворк берет на себя всю сложную работу с GStreamer или FFmpeg, позволяя сосредоточиться на построении оптимизированных конвейеров вывода с помощью декларативного синтаксиса (YAML) и функций Python. Savant позволяет создавать конвейеры (pipeline), которые одинаково работают как на ускорителях в датацентре (NVIDIA Turing, Ampere, Hopper), так и на edge-устройствах (NVIDIA Jetson NX, AGX Xavier, Orin NX, AGX Orin, New Nano). С помощью Savant можно легко обрабатывать несколько видеопотоков одновременно, быстро создавать готовые к рабочим применениям конвейеры видеоаналитики, использующие NVIDIA TensorRT. Код проекта распространяется под лицензией Apache 2.0... (3 +7) обсуждение \| весь текст

·	05.01.2024	Проблемы из-за подготовленных AI-инструментами отчётов об уязвимостях (108 +73)
	Дэниел Cтенберг (Daniel Stenberg), автор утилиты для получения и отправки данных по сети curl, выступил с критикой использования AI-инструментов при создании отчётов об уязвимостях. Подобные отчёты включают детальные сведения, написаны нормальным языком и выглядят качественными, но без вдумчивого анализа на деле могут лишь вводить в заблуждение, подменяя реальные проблемы качественно выглядящим мусорным содержимым... (108 +73) обсуждение \| весь текст

·	13.12.2023	Mozilla представила встраиваемый в браузер AI-бот MemoryCache (104 +11)
	Компания Mozilla опубликовала экспериментальное дополнение MemoryCache с реализацией диалоговой системы машинного обучения, учитывающей контент, к которому пользователь обращается в браузере. В отличие от других AI-чатов MemoryCache позволяет персонализировать общение с пользователем и использовать важные для конкретного пользователя данные при формировании ответов на вопросы. Код проекта распространяется под лицензией MPL. Установка в Firefox пока поддерживается только вручную в режиме "about:debugging" и требуется применения патча... (104 +11) обсуждение \| весь текст

·	05.12.2023	Сформирован AI Alliance для совместного развития открытых технологий искусственного интеллекта (122 –11)
	Компании IBM и Meta основали международное сообщество AI Alliance, нацеленное на совместное развитие открытых технологий, связанных с машинным обучением и искусственным интеллектом. В число учредителей проекта вошло более 50 компаний, университетов, организаций и научных учреждений, среди которых NASA, CERN, AMD, Intel, Oracle, Red Hat, Dell, Sony, Stability AI, NSF, Linux Foundation, Калифорнийский, Гарвардский, Бостонский, Иллинойский, Токийский, Йельский и Корнеллский университеты... (122 –11) обсуждение \| весь текст

·	04.12.2023	Энергозатраты на AI-генерацию изображения оказались сопоставимы с зарядкой смартфона (279 +18)
	Группа исследователей из компании Hugging Face и Университета Карнеги-Меллона опубликовала результаты анализа энергопотребления при выполнении различных моделей машинного обучения. Наиболее энергозатратными оказались модели машинного обучения, обеспечивающие генерацию изображений, а наименее затратными - классификации текста. Средние показатели энергопотребления моделей генерации изображений примерно в 1500 раз выше, чем классификации текста, и в 60 раз выше генерации текста... (279 +18) обсуждение \| весь текст

·	30.11.2023	Первый выпуск инструмента llamafile от Mozilla (34 +22)
	Разработчики из компании Mozilla представили первый выпуск утилиты llamafile, позволяющей создавать универсальные исполняемые файлы для запуска больших языковых моделей машинного обучения (LLM). При помощи llamafile можно взять файл с параметрами модели машинного обучения в формате GGUF и преобразовать его в исполняемый файл, который может запускаться в шести различных операционных системах на оборудовании с процессорами AMD64 и ARM64. Инструментарий написан на С/С++ и распространяется под лицензией Apache 2.0... (34 +22) обсуждение \| весь текст

·	22.11.2023	Представлена система синтеза видео Stable Video Diffusion (41 +26 ↻)
	Компания Stability AI опубликовала модель машинного обучения Stable Video Diffusion, позволяющую генерировать короткие видео на основе изображений. Модель расширяет возможности проекта Stable Diffusion, ранее ограниченного синтезом статических изображений. Код инструментов для обучения нейронной сети и генерации изображений написан на языке Python с использованием фреймворка PyTorch и опубликован под лицензией MIT. Уже обученные модели открыты под пермиссивной лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях... (41 +26 ↻) обсуждение \| весь текст

·	26.10.2023	Открыт код Jina Embedding, модели для векторного представления смысла текста (49 +25)
	Компания Jina открыла под лицензией Apache 2.0 модель машинного обучения для векторного представления текста - jina-embeddings-v2. Модель позволяет преобразовать произвольный текст, включающий до 8192 знаков, в небольшую последовательность вещественных чисел, образующих вектор, сопоставленный с исходным текстом и воспроизводящий его семантику (смысл). Jina Embedding стала первой открытой моделью машинного обучения, обладающей характеристиками, не уступающими проприетарной модели векторизации текста от проекта OpenAI (text-embedding-ada-002), также способной обрабатывать тексты, насчитывающие до 8192 токенов... (49 +25) обсуждение \| весь текст

·	26.09.2023	Выпуск Savant 0.2.5, фреймворка компьютерного зрения и глубокого обучения (42 +9)
	Опубликован выпуск Python-фреймворка Savant 0.2.5, упрощающего использование NVIDIA DeepStream для решения задач, связанных с машинным обучением. Фреймворк берет на себя всю сложную работу с GStreamer или FFmpeg, позволяя сосредоточиться на построении оптимизированных конвейеров вывода с помощью декларативного синтаксиса (YAML) и функций Python. Savant позволяет создавать конвейеры (pipeline), которые одинаково работают как на ускорителях в датацентре (NVIDIA Turing, Ampere, Hopper), так и на edge-устройствах (NVIDIA Jetson NX, AGX Xavier, Orin NX, AGX Orin, New Nano). С помощью Savant можно легко обрабатывать несколько видеопотоков одновременно, быстро создавать готовые к рабочим применениям конвейеры видеоаналитики, использующие NVIDIA TensorRT. Код проекта распространяется под лицензией Apache 2.0... (42 +9) обсуждение \| весь текст

Следующая страница (раньше) >>