The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Выпуск spaCy 3.0, библиотеки для обработки информации на естественном языке

01.02.2021 23:01

Компания Explosion AI опубликовала выпуск свободной библиотеки spaCy с реализацией алгоритмов обработки текста на естественном языке (NLP, Natural Language Processing). На практике проект может применяться для построения автоответчиков, ботов, классификаторов текста и различных диалоговых систем, определяющих смысл фраз. Библиотека написана на языке Python c элементами на Cython, расширении Python, допускающем прямой вызов функций на языке Си. Код проекта распространяется под лицензией MIT. Языковые модели подготовлены для 58 языков, включая русский.

Библиотека рассчитана на предоставление постоянного API, не привязанного к используемым алгоритмам и готового для применения в реальных продуктах. Для обработки информации библиотека использует самые свежие достижения в области NLP и наиболее эффективный из имеющихся алгоритмов. В случае появления более эффективного алгоритма библиотека переводится на него, но такой переход не отражается на API и приложениях. Особенностью spaCy также является архитектура, рассчитанная на обработку документов целиком, без предварительной обработки в препроцессорах, разбивающих документ на фразы. Модели предлагаются в двух вариантах - для достижения максимальной производительности и наибольшей точности.

Основные возможности spaCy:

  • Поддержка около 60 языков.
  • Доступность уже натренированных моделей для разных языков и применений.
  • Многозадачное обучение с применением предварительных натренированных трансформеров, таких как BERT (Bidirectional Encoder Representations from Transformers).
  • Поддержка предварительно натренированных векторов расстановки и встраивания слов.
  • Высокая производительность.
  • Система тренировки моделей, готовая для рабочего применения.
  • Лингвистически мотивированное разбиение на токены.
  • Наличие готовых компонентов для cвязывания именованных сущностей, маркировки частей речи, классификации текста, разбора зависимостей на основе меток, дробления предложений, пометки частей речи, морфологического анализа, лемматизации и т.п.
  • Поддержка расширения функциональности при помощи пользовательских компонентов и атрибутов.
  • Поддержка создания собственных моделей на базе PyTorch, TensorFlow и других фреймворков.
  • Встроенные инструменты для визуализации синтаксиса и cвязывания именованных сущностей (NER, Named Entity Recognition).
  • Простой процесс упаковки и развёртывания моделей, а также управления рабочим процессом.
  • Высокая точность.

Выпуск spaCy 3.0 примечателен реализацией модели для русского языка. Модель предложена в трёх вариантах (16 МБ, 41 МБ - 20 тысяч векторов и 491 МБ - 500 тысяч векторов), оптимизирована для низкой нагрузки на CPU и включает компоненты tok2vec, morphologizer, parser, senter, ner, attribute_ruler и lemmatizer.

Другие важные новшества:

  • Новый рабочий процесс тренировки моделей.
  • Новая система конфигурации.
  • Поддержка моделей (pipeline) на основе трансформеров, подходящих для многозадачного обучения.
  • Возможность подключения собственных моделей, используя различные фреймворки машинного обучения, такие как PyTorch, TensorFlow и MXNet.
  • Поддержка проектов для управления всеми этапами рабочих процессов, от препроцессинга до развёртывания моделей.
  • Поддержка интеграции с пакетами Data Version Control (DVC), Streamlit, Weights & Biases и Ray.
  • Новые встроенные компоненты: SentenceRecognizer, Morphologizer, Lemmatizer, AttributeRuler и Transformer.
  • Новый API для создания собственных компонентов.

  1. Главная ссылка к новости (https://explosion.ai/blog/spac...)
  2. OpenNews: Facebook открыл код библиотеки классификации текста fastText
  3. OpenNews: Google открыл код SyntaxNet, системы восприятия естественного языка
  4. OpenNews: Intel открыл систему машинного обучения для обработки информации на естественном языке
  5. OpenNews: Mozilla развивает собственную систему машинного перевода
  6. OpenNews: Компания Mozilla представила движок распознавания речи DeepSpeech 0.9
Лицензия: CC-BY
Тип: Программы
Короткая ссылка: https://opennet.ru/54505-spacy
Ключевые слова: spacy, ai, spacy, nlp, lang
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение (67) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Корец (?), 23:17, 01/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • –6 +/
    Я гляжу, что даже сложный софт пишется на таких языках, как пайтон. Но ведь 2.7 закопали, так? Значит весь софт, который был написан под старую версию нужно переписывать. Значит со временем текущие реализации пайтона тоже закопают и софт придётся переписывать.

    Объясните мне суть. Почему для подобных проектов не используются более "стабильные" языки?

     
     
  • 2.2, Урри (ok), 23:25, 01/02/2021 [^] [^^] [^^^] [ответить]  
  • +13 +/
    Потому что буяк-буяк и в продакшен.
    А если взлетит, то потом желающие могут и переписать на нормальном быстром языке.

    Лично я такой подход поддерживаю (с одним единым исключением - лишь бы не на джаваскрипте).

     
     
  • 3.4, Корец (?), 23:34, 01/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Звучит разумно, наверное вы правы.
     
  • 3.6, Аноним (6), 00:24, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Сабж очень быстрый и эффективный. Альтернатив подобного уровня на других языках я не знаю, куда ты там переписывать собрался?
     
     
  • 4.20, iCat (ok), 03:48, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ну он же сказал: на стабильный язык. На ассемблер. ;)
     
     
  • 5.38, Аноним (38), 10:17, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +2 +/
    ассемблер нифига не стабильный. на разных процах он отличается. выходят новые процы с еще более расширенными наборами инструкция
     
  • 4.53, Массаракш (?), 17:14, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    В пайтон удобно выбрасывать высокоуровневую логику, API, и вообще не ждать миллиард лет после каждой компиляции... а оптимизированные куску можно невозбранно переписывать на Cython - который таки компилится в Cи и машинный код и из остального кода питона дергать их.

     
     
  • 5.56, Аноним (56), 21:29, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    На Delphi пишу. Агонь. Компиляция самая быстрая на этой планете.
     
  • 3.61, Анонимный_анон (?), 08:04, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Не перепишут, потому что переписать такой слой brainware это очень большая работа, тем более с языка на язык
     
  • 2.3, Аноним (3), 23:28, 01/02/2021 [^] [^^] [^^^] [ответить]  
  • +9 +/
    Почему не на латыни комментарии пишете?
     
     
  • 3.5, Аноним (5), 23:46, 01/02/2021 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Caput tuum in ano est
     
  • 2.7, Аноним (7), 00:30, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    >Значит весь софт, который был написан под старую версию нужно переписывать.

    Всяким ретроградам прошивку надо перешивать. С ферритовых сердечников на магниторезистивную память.

     
     
  • 3.34, Аноним (34), 09:56, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Весь питон на стимпанк смахивает. Во времена, когда кругом электроника, эти жрут кактусы и делают "продакшн прожекты" на пару.....
     
  • 2.8, Ordu (ok), 00:36, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    > Почему для подобных проектов не используются более "стабильные" языки?

    Это какие, например?

     
     
  • 3.12, FractaL (ok), 00:50, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Конечно же это Rust. Нормальные проекты можно писать только на Rust. Всё остальное еритики.

    На расте тоже ничего не работает но зато безопасно неработает.

     
     
  • 4.19, Ordu (ok), 01:15, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > Конечно же это Rust. Нормальные проекты можно писать только на Rust. Всё
    > остальное еритики.

    Что серьёзно?

    > На расте тоже ничего не работает но зато безопасно неработает.

    Ты хочешь сказать, что эта модель в новости не работает? Скачал и попробовал? Прям брекинг ньюс, дополни новость.

     
  • 2.15, Аноним (15), 00:54, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    > Значит со временем текущие реализации пайтона тоже закопают и софт придётся переписывать.

    Это из ваших заключений никак не следует, но не суть. Любой живой язык развивается, и в нём депрекейтят устаревший мусор. И любой живой софт не испытывает проблем с тем чтобы за этими изменениями следовать. В питоне просто не испугались пойти на кардинальные решения и выкинуть гнильё, а не копить залежи совместимости, которые уже терминально изурововали плюсы, например. Именно и только такие языки и должны использоваться и для подобный проектов и для любых других.

     
  • 2.18, Anonim (??), 01:07, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Я гляжу, что даже сложный софт пишется на таких языках, как пайтон

    Это библиотека по сути обертка над DL моделями - в этом случаи python используется просто как frontend и на итоговую производительность влияет слабо

     
     
  • 3.28, Аноним (28), 09:11, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    > python используется просто как frontend и на итоговую производительность влияет слабо

    Ещё как влияет. NLP-проекты очень часто требуют дополнительные операции над строками. Если на Java или на Julia потери на дополнительные проверки токенов или лексем можно и не заметить, то в питон-проекте, это легко может стать причиной тотальной просадки производительности и крахом проекта в целом.

     
     
  • 4.31, Аноним (6), 09:33, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Cython == C. C производительнее julia (не в курсе за производительность) и тем более java (раз в 1000).
     
     
  • 5.32, Аноним (32), 09:54, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Cython != Python. Желающих писать проект на Cython много не найдётся. В случае CPython же, лучше его не трогать вообще....
     
     
  • 6.42, Аноним (6), 11:06, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Единственный повод использовать Cython и получить производительность равную C, это когда у тебя уже есть проект на CPython. На Cython желают писать все, кому внезапно стало не хватать производительности питона на некоторых участках, и простота, с которой можно его применить, действительно подкупает. Многие приличные батарейки используют cython, тебе нужно только немножко оптимизировать свой код вынеся горячие участки в него и остальное можно оставить без изменений.
     
     
  • 7.47, Аноним (47), 12:52, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >> На Cython желают писать все, кому внезапно стало не хватать производительности

    На Cython никто не желает писать. Просто есть современные языки программирования, а есть питон и его поклонники, уверяющие, что язык, слепленный на коленках по лекалам 70-х ещё актуален :(

     
  • 6.43, Аноним (6), 11:12, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Ну и ещё ты говоришь CPython ты подразумеваешь си с частью логики на питоне, писать на языке без интеграции с си это удел неполноценных языков. А у си, как известно, сишная производительность.
     
     
  • 7.48, Аноним (47), 12:56, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Вот посадить вас таких умных на годик другой писать на C.... Да, жить на C можно, но за этот годик-другой, программист на современном ЯП типа Julia, Rust, или, даже, C++, успеет столько написать, что догнать вы его не сможете никакой обвязкой на питоне. Надо понимать, что питон + С в 90-м году, может, и нормально. Но в 2021-м есть масса способов не использовать языки-нашлёпки.
     
  • 4.44, economist (?), 11:42, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Верно, но отчасти. Строковые методы и re в Питоне написана на С и потому быстры. Крах проекта из-за доп. проверок? - ну это уже слишком...

     
     
  • 5.49, Аноним (47), 12:57, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Ок.... Добавьте на питоне проверку окончания, например... И посмотрите сколько процентов времени будет уходить на эту проверку по сравнению с функциями, реализованными в C-коде.
     
     
  • 6.55, economist (?), 19:41, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    А куда спешить в NLP?
     
     
  • 7.57, Аноним (57), 22:53, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Даже если спешить некуда, за вычислительные ресурсы приходится платить. Впрочем, сложно представить себе сервер, который никуда не спешит...
     
  • 2.21, Галустян (?), 05:03, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Ну, во-первых, если код для 2.7 написан по PEP20+PEP8 и вовремя поддерживался, избавляясь от устаревшего, то он с большой вероятностью вообще не потребует никакого рефакторинга для работы под 3.х.
    Во-вторых, чтобы написать такое на стабильном си, понадобится пару десятилетий, если не больше ;).
     
     
  • 3.33, Аноним (7), 09:55, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    >PEP8

    вообще об оформлении, на поведение не влияет.

     
     
  • 4.50, Галустян (?), 13:30, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Оформление влияет на дисциплину, дисциплина влияет на щепетильность, щепетильность - это вопрос качества в целом, качество влияет на процент ошибок и неудачных решений в коде, а эти 2 неразлучника влияют на поведение ;).
    И да, кстати, если не писать по PEP8, значит автоматически не писать по PEP20. Они связаны.
     
  • 2.22, Галустян (?), 05:11, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Проблема не в языках, а в программистах. Их как и гитаристов - в каждом дворе не меньше пяти, да только Блэкморов и Мальмстинов среди них по 2-3 на крупный город.
     
  • 2.24, An O Nim (?), 09:00, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    > ... ... ... Но ведь 2.7 закопали, так? Значит весь софт, который был написан под старую версию нужно переписывать.
    > ... ... ...
    > ... Объясните мне суть. ... ...

    В языке на первом месте удобство для решения нужного класса задач. Питон оказался удачный язык. В чём именно, какие подробности здесь не скажу, у других публикаций много.

    На Питоне можно писать так, что работает одинаково и под 2.7 и под 3. Граммотный девелопер знает такие особенности и учитывает. Ещё грамотный дев берёт не все подряд пакеты из Pip, разбирается где хороший код, где поддержка кода.

    Поэтому хороший код довольно легко перложить с версии на версию.

    На языке Си до сих пор пишут. И архитектура железа и объём наработок на Си столь велики, что закопают, но немало поколений ИТ ещё выйдет в тираж раньше события.

    P.S. Из практики: да, действительно, на иных языках употеешь там, где на Питоне через полчаса уже "Весчъ" сделана. :) А широкие возможности тяп ляп... так это сами себе злые буратино и девелопер и родители девелопера.

     
     
  • 3.40, Аноним (6), 10:51, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Не совсем одинаково, и это надевание совы на глобус А после 3 2 вообще не актуа... большой текст свёрнут, показать
     
     
  • 4.52, Галустян (?), 15:43, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Фейспалм и ахтунг. Вы точно про синьоров с седыми волосами или всё-таки про новую волну кодеров с завышенным чсв и серверами развёрнутыми в прошлом году?
     
     
  • 5.54, Аноним (6), 18:10, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Фейспалм и ахтунг. Вы точно про синьоров с седыми волосами или всё-таки
    > про новую волну кодеров с завышенным чсв и серверами развёрнутыми в
    > прошлом году?

    Седым мулям пхп подавай, пусть там и остаются, на пхп3.

     
  • 2.27, Аноним (57), 09:05, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Объясните мне суть. Почему для подобных проектов не используются более "стабильные" языки?

    Питон и всё, что вокруг него - игрушки для детей. Поэтому, поигрались, надоело, и выбросили. Следующее поколение "детей" всё равно не будет использовать опыты предыдущих.

    Ни для чего другого, питон не пригоден.

     
     
  • 3.37, Аноним (7), 10:03, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    С 1990 так говорят ...
     
     
  • 4.39, Аноним (34), 10:30, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Ну так количество детей с компьютером с тех пор сильно увеличилось.
     

  • 1.9, Аноним (9), 00:42, 02/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    И как всегда на питоне долбануться можно пока установишь. Про эти пипы заливать не надо, нормальные люди мусор в систему не тянут.
     
     
  • 2.10, Far (ok), 00:47, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    А использовать requirements, который присутсвует в гите, религия не позволяет?
     
     
  • 3.26, An O Nim (?), 09:02, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Так у автора тезис: Пип - помойка.

    Так и есть, в Пипе много отбросов. Увы.

    Низкий порог входа дал много мусора. Вероятно.

    Своё под ключ писать нормально, а вот чужое переиспользовать просто так нельзя, нужно разбираться в сортах.

     
  • 2.11, Аноним (6), 00:47, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Кончено же не ставят. Нормальные люди знают про venv. В одну команду ставится, с минимумом затрат, как и всегда.
     
     
  • 3.13, Аноним (13), 00:51, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Тот же мусор только чуть более локализованный.
     
  • 3.14, Аноним (14), 00:53, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Что и требовалось доказать. У питона как всегда всё через одно место.
     
     
  • 4.17, Аноним (15), 00:58, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Что доказать-то? Мы доказали что в твоём дистрибутиве spacy не опакечен из коробки, что является проблема исключительно твоего говённого дистрибутива. Но даже для таких питон позволяет установить spacy одной командой своими средствами. Что тебе не нравится?
     
     
  • 5.65, Аноним (65), 11:08, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    У него NIH syndrome.
     
  • 3.35, Аноним (7), 09:57, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Venv, pipenv, poetry - для смузихлёбных карго-культистов - фанатов докера и снапа.
     
     
  • 4.41, Аноним (6), 10:57, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Только virtualenv, только хардкор? Просто venv штатный механизм, и остальные нет. Подобная изоляция довольно удобна, мне например нужны определённые версии для определённых проектов. И для разработки зачастую нужны предрелизные версии, либо старые версии как зависимости, у тебя вариант или копировать из гитхаба руками или использовать pip, но в любом случае без "песочницы" ты засрёшь батарейками всю систему, и в итоге ничего работать не будет.
     
     
  • 5.59, Аноним (59), 01:31, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Доверься мне.

    python3 -m build -nwx
    sudo pip3 install --upgrade ./dist/*whl

    И никаких проблем.

     
  • 5.60, Аноним (59), 01:33, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    >засрёшь батарейками всю систему, и в итоге ничего работать не будет.

    Только /usr/local/python3*/dist-packages/. Она для этого и предназначена, вообде-то.

     
     
  • 6.64, Аноним (6), 11:04, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    >>засрёшь батарейками всю систему, и в итоге ничего работать не будет.
    > Только /usr/local/python3*/dist-packages/. Она для этого и предназначена, вообде-то.

    Там не будет никакого разделения. Типичный хелловорлд имеет под тысячу зависимостей и они будут блокировать часть обновлений (как минимум), либо сломаются, если ты всё-таки обновишь. Вот допустим 900 пакетов из этой тысячи можно обновить спокойно, но 2 пакета (временно) блокируют тебе оставшиеся. Но они могут не использоваться в соседнем проекте, где при этом используются те 98 блокированных пакетов вместе с теми 900.

     
  • 2.16, Аноним (15), 00:56, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Что за чушь, ставится одной командой из родной репы дистрибутива:

    https://repology.org/project/python:spacy/versions

     
  • 2.23, Аноним (23), 08:51, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Напиши ебылд для нормального дистра.
     
  • 2.30, bergentroll (ok), 09:32, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Я прошу прощения, а что для вас образец хорошего, чтоб не мусор?
     

  • 1.25, Аноним (28), 09:00, 02/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Что же она такая медленная?... Даже в сравнении с OpenNLP
     
  • 1.29, Аноним12345 (?), 09:28, 02/02/2021 Скрыто модератором [﹢﹢﹢] [ · · · ]
  • –2 +/
     
  • 1.36, Аноним (7), 10:02, 02/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Нет поддержки i686 - значит либа не нужна.
     
     
  • 2.46, Аноним (46), 11:49, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +1 +/
    i686 уже не нужен.
     
  • 2.62, Аноним (65), 10:53, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    NLP на i686 - это несерьезно.
     
     
  • 3.68, Аноним (68), 10:46, 05/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    >NLP на не суперкомпьютере - это несерьезно.

    Пофиксил. Если нужно серьёзно - то это к майкрософту, гуглу, яндексу и сберу и ещё нескольким компаниям. Всё остальное несерьёзно.

     

  • 1.51, Аноним (51), 13:38, 02/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ждем реализации на нормальном языке без зависимостей и блотвари. Прототипы и концепты это не показатель и уж точно не принимо.
     
     
  • 2.58, COBA (?), 23:15, 02/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Вопрос только в том - для чего ждать?
     
     
  • 3.66, Аноним (66), 15:31, 03/02/2021 [^] [^^] [^^^] [ответить]  
  • +/
    Ну вот когда будет хоть какие-либо бенчмарки проходить - подумаем о применении.
     

  • 1.63, Аноним (65), 11:02, 03/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >Языковые модели подготовлены для 58 языков

    В новости же сказано по 59 моделей для 18 языков: "spaCy v3.0 provides retrained model families for 18 languages and 59 trained pipelines in total".

     
  • 1.67, Аноним (67), 23:48, 03/02/2021 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Не такой уж и постоянный у них API. Внутри меняются алгоритмы и от версии к версии эта поделка дает разный результат. Требуется корректировка моделей. Или привязку к версии, но старые версии они грохают со своего варезника ибо EoL.
    В долгосрочной перспективе - так себе либа. Но для наколенных поделок, чтобы работало с понедельника и до обеда - вполне зачетно.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    Inferno Solutions
    A-Real
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2021 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру