The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

/ Для программиста / Машинное обучение, AI
08.07.2020 Новая система оптического распознавания текста EasyOCR (14 +2)
  Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов...
14.06.2020 PIFu - система машинного обучения для построения 3D-модели человека на основе 2D-снимков (97 +16)
  Группа исследователей из нескольких американских университетов опубликовала проект PIFu (Pixel-Aligned Implicit Function), позволяющий применить методы машинного обучения для построения 3D-модели человека по одному или нескольким двумерным изображениям. Система позволяет воссоздавать сложные варианты одежды, такие как юбки со складками и туфли на каблуках, и различные причёски, самостоятельно восстанавливая текстуру и форму в областях, невидимых в проекции, по которой производится построение 3D-модели. Для увеличения качества и детализации итоговой 3D-модели может применяться несколько изображений в разных ракурсах. Код проекта написан на языке Python с использованием фреймворка PyTorch и распространяется под лицензией MIT...
04.05.2020 Прототип интерфейса для переноса изображений из реального мира в графический редактор (81 +19)
  Сириль Диань (Cyril Diagne), французский художник, дизайнер, программист и экспериментатор в области интерфейсов взаимодействия с пользователем, опубликовал прототип приложения ar-cutpaste, использующего технологии дополненной реальности для переноса изображений из реального мира в графический редактор. Программа позволяет при помощи мобильного телефона сделать снимок любого реального объекта с нужным ракурсом, после чего приложение уберёт фон и оставит только этот объект. Далее пользователь может навести фокус камеры мобильного телефона на экран компьютера с запущенным графическим редактором, выбрать точку и вставить объект в эту позицию...
12.04.2020 FairMOT, система для быстрого отслеживания нескольких объектов на видео (82 +5)
  Исследователи из компании Microsoft и Университета Центрального Китая разработали новый высокопроизводительный метод отслеживания нескольких объектов на видео с использованием технологий машинного обучения - FairMOT (Fair Multi-Object Tracking). Код с реализацией метода на базе Pytorch и натренированные модели опубликованы на GitHub...
11.04.2020 Google опубликовал данные и модель машинного обучения для разделения звуков (51 +16)
  Компания Google опубликовала базу данных эталонных смешанных звуков, снабжённую аннотациями, которую можно использовать в системах машинного обучения, применяемых для разделения произвольных смешанных звуков на отдельные компоненты. Также опубликована универсальная модель глубинного машинного обучения (TDCN++), которая может быть использована в Tensorflow для разделения звуков. Данные подготовлены на основе коллекции freesound.org и опубликованы под лицензией CC BY 4.0...
16.02.2020 Google представил AutoFlip, фреймворк для умного кадрирования видео (59 –6)
  Компания Google представила открытый фреймворк AutoFlip, предназначенный для кадрирования видео с учётом смещения ключевых объектов. AutoFlip использует методы машинного обучения для отслеживания объектов в кадре и оформлен как надстройка над фреймворком MediaPipe, который использует TensorFlow. Код распространяется под лицензией Apache 2.0...
26.12.2019 Обновление MediaPipe, фреймворка для обработки видео и звука с использованием машинного обучения (12 +3)
  Компания Google представила обновление фреймворка MediaPipe, предлагающего набор готовых функций для применения методов машинного обучения при обработке видео и звука в режиме реального времени. Например, MediaPipe можно использовать для распознавания лиц, отслеживания движения пальцев и рук, замены причёски, выявления наличия объектов и отслеживания их перемещения в кадре. Код проекта...
11.11.2019 Открыт код Spleeter, системы для разделения музыки и голоса (57 +32)
  Провайдер потокового вещания Deezer открыл исходные тексты экспериментального проекта Spleeter, развивающего систему машинного обучения для разделения источников звука из сложных звуковых композиций. Программа позволяет удалить из композиции вокал и оставить только музыкальное сопровождение, манипулировать звучанием отдельных инструментов или отбросить музыку и оставить голос для наложения на другой звуковой ряд, создавать миксы, караоке или транскрипции. Код проекта написан на языке Python с использованием движка Tensorflow и распространяется под лицензией MIT...
21.10.2019 Mozilla развивает собственную систему машинного перевода (89 +48)
  Компания Mozilla в рамках проекта Bergamot приступила к созданию системы машинного перевода, работающей на стороне браузера. Проект позволит интегрировать в Firefox самодостаточный движок перевода страниц, не обращающийся к внешним облачным сервисам и обрабатывающий данные исключительно на системе пользователя. Главной целью разработки является обеспечение конфиденциальности и защита данных пользователя от возможных утечек при переводе содержимого открываемых в браузере страниц...
04.10.2019 Открыт код для синтеза анимации с помощью нейросетей (103 +15)
  Группа исследователей из шанхайского технического университета опубликовала инструментарий Impersonator, позволяющий при помощи методов машинного обучения симулировать движения людей по статическим изображениям, а также заменять одежду, переносить в другое окружение и менять ракурс с которого виден объект. Код написан на языке Python...
01.10.2019 Выпуск системы машинного обучения TensorFlow 2.0 (89 +9)
  Представлен значительный выпуск платформы машинного обучения TensorFlow 2.0, предоставляющей готовые реализации различных алгоритмов глубокого машинного обучения, простой программный интерфейс для построения моделей на языке Python и низкоуровневый интерфейс для языка С++, позволяющий управлять построением и выполнением вычислительных графов. Код системы написан на языках С++ и Python и распространяется под лицензией Apache...
27.09.2019 GitHub открыл наработки по применению машинного обучения для поиска и анализа кода (24 +7)
  GitHub представил проект CodeSearchNet, в рамках которого подготовлены модели машинного обучения и наборы данных, необходимые для разбора, классификации и анализа кода на различных языках программирования. CodeSearchNet, по аналогии с ImageNet, включает большую коллекцию отрывков кода, снабжённых аннотациями, формализующими выполняемые кодом действия. Компоненты для обучения моделей и примеры использования CodeSearchNet написаны на языке Python с использованием фреймворка Tensorflow и распространяется под лицензией MIT...
17.05.2019 Microsoft открыл код библиотеки векторного поиска, используемой в Bing (91 +6)
  Компания Microsoft опубликовала исходные тексты библиотеки машинного обучения SPTAG (Space Partition Tree And Graph) с реализацией алгоритма приблизительного поиска ближайшего соседа. Библиотека разработана в исследовательском подразделении Microsoft Research и центре разработки поисковых технологий (Microsoft Search Technology Center). На практике SPTAG применяется в поисковой системе Bing для определения наиболее релевантных результатов с учётом контекста и задания поисковых запросов на естественном языке. Код написан на языке С++ и распространяется под лицензией MIT. Поддерживается сборка для Linux и Windows. Имеется обвязка для языка Python...
13.04.2019 NVIDIA открыла код системы машинного обучения, синтезирующей пейзажи по наброскам (45 +18)
  Компания NVIDIA опубликовала исходные тексты системы машинного обучения SPADE (GauGAN), позволяющей синтезировать реалистичные пейзажи на основе грубых набросков, а также связанные с проектом натренированные модели. Система была продемонстрирована в марте на конференции GTC 2019, но код был опубликован только вчера. Наработки открыты под несвободной лицензией CC BY-NC-SA 4.0 (Creative Commons Attribution-NonCommercial-ShareAlike 4.0), допускающей использование только в некоммерческих целях. Код написан на языке Python с применением фреймворка PyTorch...
03.04.2019 Выявлен способ обмана автопилота Tesla для выезда на полосу встречного движения (149 +23)
  Исследователи безопасности из Tencent Keen Security Lab нашли способ ввести в заблуждение автопилот автомобилей Tesla и спровоцировать его на выезд на встречную полосу движения. Суть предложенной техники в размещении на дороге трёх меток, незаметных для водителя, но определяемых автопилотом. Метки размещаются рядом с местом разрыва сплошной разметки со встречной полосой, поэтому автопилот воспринимает их как часть разметки, предписывающей перестроится в другой ряд, и не учитывает, что этот другой ряд находится на полосе встречного движения...
Следующая страница (раньше) >>



Спонсоры:
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2020 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру