forum.opennet.ru - "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с формальной верификацией" (118)

"Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с формальной верификацией"

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Изначальное сообщение		[ Отслеживать ]

"Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с формальной верификацией"	+/–
Сообщение от opennews (??), 17-Мрт-26, 11:31
Компания Mistral AI представила большую языковую модель Devstral, нацеленную на использование для разработки приложений (вайб-кодинга) и оптимизированную для формальной верификации кода. Предполагается, что Devstral может применяться для создания AI-ассистентов, позволяющих не просто генерировать код, но и гарантировать отсутствие в нём ошибок... Подробнее: https://www.opennet.ru/opennews/art.shtml?num=65005
Ответить \| Правка \| Cообщить модератору

Оглавление

Кто пользуется подобным, какое железо нужно, чтобы запустить Сам использую qwen, Аноним (1), 11:31 , 17-Мрт-26, (1)

https huggingface co mistralai Leanstral-2603 tree main Дорогое , Аноним (4), 11:38 , 17-Мрт-26, (4)

Замечу что из описания следует что русский язык оно не поддерживает, Джон Титор (ok), 11:41 , 17-Мрт-26, (6) –8

На кириллице кодите Что не комментарий от вас, то откровение , Аноним (4), 13:09 , 17-Мрт-26, (42) +14

1C, aname (ok), 13:19 , 17-Мрт-26, (45) +3

вайб-кодинг 1С К такому я ещё не готов , Аноним (4), 16:09 , 17-Мрт-26, (67) +4

Зря, Джон Титор (ok), 20:37 , 17-Мрт-26, (101) +6

Дык он из будущего Он знает , Аноним (59), 15:22 , 17-Мрт-26, (59) +1

В статье ссылка https huggingface co mistralai Leanstral-2603Там в файле Read, Джон Титор (ok), 20:34 , 17-Мрт-26, (98)
На всякий случай выпишу, а то не найдете Leanstral offers these capabilities Mu, Джон Титор (ok), 20:36 , 17-Мрт-26, (99)

На CESIL Тут целая история https blog scribblings com progaming-languages-1-, Джон Титор (ok), 16:34 , 26-Мрт-26, (144)

Поддерживает , Аноним (73), 16:27 , 17-Мрт-26, (73) –1

Может вы спросите у этого ИИ https chat mistral ai chat, Джон Титор (ok), 09:37 , 18-Мрт-26, (119) +1

Естественно Придется Core 2 Duo апгрейдить А это дорого На макарошки не хвати, подчиняйся свободе GPL (?), 14:45 , 17-Мрт-26, (56)

Тут главное видеокарта и её объем памяти Лучше брать все что выше 16Гб и NVidia, Джон Титор (ok), 11:39 , 17-Мрт-26, (5) –4

А дешевле - ровно 16 гигабайт или ниже и не nvidia , Аноним (87), 19:31 , 17-Мрт-26, (87)

А дешевле можно, но даже ради учебы - пустая трата времени Генерировать будет, , Джон Титор (ok), 20:40 , 17-Мрт-26, (104)

Чтоб хоть как-то запустилось 128 Гб DDR5 ОЗУ Или можно одну NVIDIA H200 , Аноним (4), 11:59 , 17-Мрт-26, (12)

И выдало хоть какие-то результаты , Аноним (34), 12:56 , 17-Мрт-26, (34)
А оно хоть Doom запустит , Джон Титор (ok), 20:41 , 17-Мрт-26, (106) –1

Нужно было интересоваться до взлета цен на память Купить максимум во все слоты , Аноним (13), 12:02 , 17-Мрт-26, (13) –4

Вообще-то максимум для DDR5 4x48 Gb, но нужна поддержка процом и мамой , Аноним (29), 12:50 , 17-Мрт-26, (29) –1
То замёрзла, то загнила, то ли дело у нас , Аноним (4), 14:51 , 17-Мрт-26, (57) +2
GPT OSS даже 20b дает во все щели убогому квен, а так квен самые слабые модели , Джон (?), 12:34 , 18-Мрт-26, (126)

Вообще чем мощнее тем лучше, дальше по убыванию скорости генерации 1 вся модел, Андрей (??), 12:02 , 17-Мрт-26, (14) +2

А дальше уже всё будет ограниченно самим чипом, контроллером памяти и даже самой, Аноним (4), 17:40 , 17-Мрт-26, (83) +1

В моделях как правило есть ещё B параметры B биллионы, миллиарды Параметры , Джон Титор (ok), 12:06 , 17-Мрт-26, (17) +3

Всё чётко разложил Что посоветуете на бюджет до 4500-5000 евро Интересно именн, booksy (?), 14:34 , 17-Мрт-26, (54)

https www google com search q hl ru aep 22 udm 50, Аноним (4), 16:22 , 17-Мрт-26, (71)
Openrouter И найти работу , Аноним (82), 17:36 , 17-Мрт-26, (82)

Кому этот хлам в 2026 сдался Уже вагон сервисов с оплатой по сбп и дешевле раза, Джон (?), 12:36 , 18-Мрт-26, (128)

Дешевле это 1 5 тыщи за 1М токенов , Аноним (134), 10:03 , 19-Мрт-26, (134)

routerai dot ru и кими к2,5, Джон (?), 12:35 , 18-Мрт-26, (127)
Я вот сейчас экспериментально разбираюсь И тут люди, да и я обращают внимание н, Джон Титор (ok), 11:44 , 02-Апр-26, (146)

На HF народ квантует Пишут что PerformanceOn 2x RTX 4090 48GB VRAM 192GB RA, geth (?), 12:09 , 17-Мрт-26, (18)

Вредный совет, сколько уже людей обожглись на всяких PELADN и т д Все эти подвал, Аноним (4), 16:18 , 17-Мрт-26, (70)

Уговорили, тогда покупайте H200, делов на 30 минут , geth (?), 16:23 , 17-Мрт-26, (72)

не H200 конечно, но всяко дешевле чем nvidia или mac - https www kickstarter c, Ванька с огорода (?), 21:35 , 17-Мрт-26, (108)

Есть сомнения в дешевизне т к его не получится подключать к дешманским ноутам В, Аноним (4), 21:57 , 17-Мрт-26, (109)

Квантизация сильно ухудшает умственные возможности моделей Даже если в бенчмарк, Аноним (92), 19:42 , 17-Мрт-26, (92) +1

Данные свежие, март 2026 Строю большую сводную таблицу по тирам Тир 0 8212 C, Джон Титор (ok), 12:18 , 17-Мрт-26, (21) +4

Спасибо , Аноним (59), 15:28 , 17-Мрт-26, (60)

Вы тоже самое можете спрашивать из чатов, как он и сделал 1 https www google , Аноним (4), 16:07 , 17-Мрт-26, (65)
Имей в виду что знания ИИ обновляются раз в год Поэтому модели реально можно по, Джон Титор (ok), 20:28 , 17-Мрт-26, (96)
И да, не грузите несколько больших моделей в память одновременно если не влезет , Джон Титор (ok), 20:31 , 17-Мрт-26, (97)

Чтобы нормально работать вся модель должна влазьть в VRAM, а RAM брать в дваразы, Аноним (66), 16:08 , 17-Мрт-26, (66) –1

NVIDIA H200, Аноним (4), 16:12 , 17-Мрт-26, (69)

Посмотрел спеки на H200 NVL VRAM - 141GBint8 - 3 3 PFLOPS така видяшка и в TOP5, Аноним (66), 17:12 , 17-Мрт-26, (77)

Ну нет, там совсем другая точность В топовых кластерах тысячи таких H200 устано, Аноним (4), 17:26 , 17-Мрт-26, (80)

Никто не использует видеокарты вне дата-центров для запуска LLM У нас в компани, vibecoder (?), 06:39 , 18-Мрт-26, (117)

Сравни скорость памяти и скорость вычислений int8 Для запуска чужой готовой моде, Аноним (118), 08:50 , 18-Мрт-26, (118)

Он прав Мак ты всегда продаш по очень ликвидной цене А вот твоё б у GPU нафиг , Аналоговнет (-), 10:03 , 18-Мрт-26, (121) –1

CPU сегодня от видях не сильно отстаёт Intel 174 Xeon 174 6980P Processor504, Аноним (124), 11:00 , 18-Мрт-26, (124)

Память, шина и прочие бутылочные горлышки учитываются в вашем расчёте , Аноним (-), 11:12 , 18-Мрт-26, (125)

Да учитывается Xeon 174 6980P - производительность в 838 TOPS int8 подтвержден, Аноним (131), 17:19 , 18-Мрт-26, (131)
Только вот int8 это овощ Минимум fp8, а лучше bf16 Вопреки бэнчмаркам, на реал, vibecoder (?), 08:38 , 20-Мрт-26, (137)

P S Вдогонку, обучать и тюнить модель выгоднее на облачном сервисе, где ты арен, Аналоговнет (-), 10:05 , 18-Мрт-26, (122)

Вообще железо нужно мощьное, но облачный сервис всегда будет дешевле, скидки , nagual (ok), 16:10 , 17-Мрт-26, (68) –1
запустить любой ПК с 128ГБ ОЗУ без ГПУ я например на арендованных топовых райз, Анонисссм (?), 21:08 , 17-Мрт-26, (107)

О, это уже не плохо Sonnet 4 уже хорош, а 4 5 немного лучше 4 6 там не особо т, Джон Титор (ok), 11:34 , 17-Мрт-26, (2)
Хихи, маркетологи нынче зажигают на тему взаимоисключающих параграфов , Аноним (-), 11:48 , 17-Мрт-26, (8) +8

А где противоречие Модель просто обучили в том числе на ошибках Aeneas Модель в, Аноним (10), 11:53 , 17-Мрт-26, (10)

В итоге, модель научится писать код, проходящий конкретный верификатор А вовсе , Аноним (15), 12:03 , 17-Мрт-26, (15)

Если не нормально работающий код проходит ваш верификатор то проблема в вер, Аноним (16), 12:06 , 17-Мрт-26, (16) +1

Вся проблема, что написать полностью правильную верификацию на код, не проще чем, Хрю (?), 12:17 , 17-Мрт-26, (20) +3

вот только сначала тебе в норме надо было написать и код верификации, и код под , Аноним (-), 12:46 , 17-Мрт-26, (27) –1

Сейчас верификацию на код пишут, мягко скажем очень редко, и в мегакритикал сист, Хрю (?), 12:50 , 17-Мрт-26, (28)

тогда о чем разговор у нас нет верификатора, потому мы хотим, чтобы модель, зат, Аноним (-), 12:55 , 17-Мрт-26, (32)

Разговор про то что дешевле и лучше не стало, а просто одну сложность написание, Хрю (?), 13:03 , 17-Мрт-26, (38)

Дак стало или нет А там, где писали верификацию, стало легче или нет Или раз ник, Аноним (-), 13:05 , 17-Мрт-26, (40)

Верификацию пишут для всяких контроллеров и т п критикал вещей, там не только н, Хрю (?), 13:42 , 17-Мрт-26, (46)

я очень рад, что ты признаешь, что есть сферы, где верификация очень важнаэто не, Аноним (-), 16:03 , 17-Мрт-26, (63)

облАжить тестами - это зачЁт , Аноним (37), 13:02 , 17-Мрт-26, (37)

Нюанс в том, что 99 6ыdlo-кодеров никогда в жизни не писали спецификаций Максим, Аноним (30), 12:51 , 17-Мрт-26, (30)

вот то же самоетогда о чем разговор у нас нет верификатора, потому мы хотим, чт, Аноним (-), 12:56 , 17-Мрт-26, (35)

Анонимные эксперты с опеннета хотят, чтоб за них всё делала нейрослопть, а они с, aname (ok), 13:45 , 17-Мрт-26, (47) –2

Скрыто модератором, Аноним (92), 20:02 , 17-Мрт-26, (94) +1

Скрыто модератором, aname (ok), 20:39 , 17-Мрт-26, (103)

По-моему, ты путаешь формальную верификацию со статическим анализом Формальная , Аноним (51), 13:51 , 17-Мрт-26, (51) +1

Но есть нюанс процесс не обязан сходиться Практика применения ИИ показывает, ч, Аноним (34), 13:03 , 17-Мрт-26, (39)

Что значит не обязан сходится Практика применения ИИ показывает, что от людей , aname (ok), 13:46 , 17-Мрт-26, (48) –1

С такими вопросами - к математикам, но они от ИИ тупеют, от того самого, который, Аноним (34), 14:37 , 17-Мрт-26, (55)

www youtube com watch v JHEO7cplfk8Вот наглядное пособие, приглядитесь по вним, Аноним (58), 15:19 , 17-Мрт-26, (58)

Какой процесс у тебя там не сходится Верификация должна гарантировать соответст, Аноним (64), 16:06 , 17-Мрт-26, (64) –1

Чем отличается верификация от имплементации - тебе надо рассказывать , Аноним (34), 17:35 , 17-Мрт-26, (81)

Мне надо Расскажи, будь ласка , anonymos (?), 03:51 , 18-Мрт-26, (114)

Да вы батенька бред несете Ну или ваша практика это модели из 2023 года , Аноним (92), 19:58 , 17-Мрт-26, (93)

Нейрослоп вышел на новый уровень , Аноним (11), 11:59 , 17-Мрт-26, (11)

Вангуется очередное повышение цен на память в 2 раза , Аноним (34), 13:08 , 17-Мрт-26, (41)
Ими кстати ASML заинтересовались https www asml com en news press-releases 202, Аноним (4), 13:13 , 17-Мрт-26, (44)
Слоп остался в 2023 году Нынче нейронка в большинстве случаев генерирует более , Аноним (92), 19:35 , 17-Мрт-26, (90) +1

привет, сатья наделла тебя действительно настолько задевает корень слоп , анон (?), 12:41 , 25-Мрт-26, (142)

Осталось теперь подтвердить, что описанное в спецификации - это именно то, что и, Аноним (22), 12:20 , 17-Мрт-26, (22) +4

Ну если условные вы не способны написать спецификации, то тут не только нейрос, aname (ok), 13:48 , 17-Мрт-26, (49)

www youtube com watch v JHEO7cplfk8Ну вот, чем, по вашему, тут занята ЫЫ , Аноним (58), 15:32 , 17-Мрт-26, (62)

Главное, что понаделал кожаный мешок, aname (ok), 17:13 , 17-Мрт-26, (78)

ну так чем там занята ЫЫ , Аноним (58), 17:58 , 17-Мрт-26, (84)

Писала коммент, на который я сейчас отвечаю, aname (ok), 20:40 , 17-Мрт-26, (105) –1

ч и т д , Аноним (58), 22:54 , 17-Мрт-26, (110)

Вы совершенно правы, я ошиблась в спецификации - ваш рентгеновский аппарат совер, Аноним (73), 16:32 , 17-Мрт-26, (74) +2

не гарантирует, что код оптимальный Чтобы получить единицу , можно сделать 0 1, Аноним (34), 12:53 , 17-Мрт-26, (31)

А мясной мешок гарантирует оптимальность Ну и какую именно оптимальность По п, Аноним (36), 13:02 , 17-Мрт-26, (36) –2

Ну вот с этого надо и начинать, это равносильно понятию эффективно вычислимой фу, Аноним (58), 15:30 , 17-Мрт-26, (61) +1
Мясной мешок держит в голове контекст длиною в жизнь, и знает в каких случаях оп, Аноним (92), 19:32 , 17-Мрт-26, (88) +1
Животное, все эти ИИ сделаны человеком ты и тебе подобные так орут, словно ИИ с, Аноним (133), 08:36 , 19-Мрт-26, (133)

Ну так критерии оптимальности, для начала, завезите , aname (ok), 13:51 , 17-Мрт-26, (50) –2

Вайбкод 1 модель тренировали на общедоступном мусоре, а не топовых примерах код, Bob (??), 13:12 , 17-Мрт-26, (43) +3

Ты ошибаешься, модели тренируют как раз на Ынтерпрайзном коде, отсюда и берутся , Аноним (92), 19:29 , 17-Мрт-26, (86) +3
Про человекочасы тут зависит от опыта работы и задачи Прототип или proof of wor, Аноним (134), 10:14 , 19-Мрт-26, (135) –1

И откуда уверенность, что , Аноним (139), 09:50 , 21-Мрт-26, (139)

Современные AI итак генерируют синтаксически верный код в 99 случаев Проблем, Аноним (92), 19:28 , 17-Мрт-26, (85) +5

Ну так прокладка в виде человека для чего нужна , Аноним (134), 10:14 , 19-Мрт-26, (136)

прочитай пост повторно и попробуй осмыслить, что имел ввиду комментатор выше оч, анон (?), 12:44 , 25-Мрт-26, (143)

А если поставить Aider, то больше команда разработчиков не нужна, Джон Титор (ok), 10:39 , 18-Мрт-26, (123) –1

Что, плохо продаются вайб-курсы модельки , Аноним (139), 09:49 , 21-Мрт-26, (138)

А что вас заинтересовало , Джон Титор (ok), 00:20 , 22-Мрт-26, (140)

А почему вы спрашиваете , Любитель курсов (?), 15:30 , 23-Мрт-26, (141)

А что вы предлагаете OpenDevin, GPT PILOT, Plandex Разве Aider не проще допилит, Джон Титор (ok), 21:18 , 30-Мрт-26, (145)

Сообщения [Сортировка по времени | RSS]

1. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (1), 17-Мрт-26, 11:31

Кто пользуется подобным, какое железо нужно, чтобы запустить? Сам использую qwen code, было бы интересно запускать всё локально

Ответить | Правка | Наверх | Cообщить модератору

4. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 11:38

>Leanstral-2603  121 GB
https://huggingface.co/mistralai/Leanstral-2603/tree/main
Дорогое.

Ответить | Правка | Наверх | Cообщить модератору

6. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –8 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 11:41

Замечу что из описания следует что русский язык оно не поддерживает

Ответить | Правка | Наверх | Cообщить модератору

42. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +14 +/–

Сообщение от Аноним (4), 17-Мрт-26, 13:09

На кириллице кодите ? Что не комментарий от вас, то откровение.

Ответить | Правка | Наверх | Cообщить модератору

45. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +3 +/–

Сообщение от aname (ok), 17-Мрт-26, 13:19

1C

Ответить | Правка | Наверх | Cообщить модератору

67. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +4 +/–

Сообщение от Аноним (4), 17-Мрт-26, 16:09

вайб-кодинг 1С ? К такому я ещё не готов.

Ответить | Правка | Наверх | Cообщить модератору

101. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +6 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:37

Зря

Ответить | Правка | Наверх | Cообщить модератору

59. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (59), 17-Мрт-26, 15:22

Дык он из будущего. Он знает.

Ответить | Правка | К родителю #42 | Наверх | Cообщить модератору

98. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:34

В статье ссылка: https://huggingface.co/mistralai/Leanstral-2603
Там в файле Readme все написано. Вы ведь английский знаете?
p.s. я тоже знаю, но терпеть не могу.

Ответить | Правка | Наверх | Cообщить модератору

99. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:36

На всякий случай выпишу, а то не найдете:
Leanstral offers these capabilities:
Multilingual: Supports English, French, Spanish, German, Italian, Portuguese, Dutch, Chinese, Japanese, Korean, and Arabic

Ответить | Правка | К родителю #59 | Наверх | Cообщить модератору

144. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 26-Мрт-26, 16:34

> На кириллице кодите ? Что не комментарий от вас, то откровение.
На CESIL. Тут целая история: https://blog.scribblings.com/progaming-languages-1-cesil

Ответить | Правка | К родителю #42 | Наверх | Cообщить модератору

73. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (73), 17-Мрт-26, 16:27

Поддерживает.

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

119. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Джон Титор (ok), 18-Мрт-26, 09:37

> Поддерживает.
Может вы спросите у этого ИИ? https://chat.mistral.ai/chat
> Какая ты модель? Какие языки поддерживаешь?
>> Я — Le Chat, помощник на основе искусственного интеллекта, созданный Mistral AI. Поддерживаю множество языков, включая украинский, русский, английский, французский, испанский, немецкий и многие другие.
> На сайте в документации: https://huggingface.co/mistralai/Leanstral-2603 указано что ты поддерживаешь много языков, но русского там нет
>> Давай разберёмся: модель Leanstral-2603 — это специализированный кодовый агент от Mistral AI, предназначенный для работы с Lean 4 (языком доказательств и формальной верификации). Она оптимизирована для формальных доказательств, работы с математическими объектами и спецификациями программного кода, а не для общения на естественных языках. Поэтому в её документации не упоминаются языки вроде русского, английского или украинского — она просто не предназначена для этого
>> Я же, как Le Chat, — это универсальная языковая модель, которая поддерживает множество естественных языков, включая русский, украинский, английский и другие. Если у тебя есть вопросы по программированию, математике или просто общение — спрашивай!
> То Leanstral-2603 не поддерживает русский или поддерживает?
>> Модель Leanstral-2603 — это специализированный кодовый агент для работы с Lean 4, она не предназначена для общения на естественных языках, включая русский. Её основная задача — помощь в формальных доказательствах и работе с математическими объектами, а не поддержка разговорных языков

Ответить | Правка | Наверх | Cообщить модератору

56. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от подчиняйся свободе GPL (?), 17-Мрт-26, 14:45

Естественно. Придется Core 2 Duo апгрейдить. А это дорого. На макарошки не хватит

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

5. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –4 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 11:39

Тут главное видеокарта и её объем памяти. Лучше брать все что выше 16Гб и NVidia. Можно конечно и под других производителей адаптировать, а некоторые сразу поддерживают, но чаще всего для этого придется потанцевать с бубном. Можно все немного ускорить заморозив код и скомпилировать пайтон, но правки придется делать. Процессор хороший тоже не помешал бы, бывает что-то слетает и если протанцевали с бубном под не ту видеокарту под которую оно сделано, то можно настроить переход на процессор, но это в 10 раз дольше выполнение.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

87. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (87), 17-Мрт-26, 19:31

>Лучше брать все что выше 16Гб и NVidia.
А дешевле - ровно 16 гигабайт или ниже и не nvidia.

Ответить | Правка | Наверх | Cообщить модератору

104. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:40

А дешевле можно, но даже ради учебы - пустая трата времени. Генерировать будет, но медленно. И текст, и картинки. Можно вообще на CPU или оптимизированные модели. Но лучше это время потратить с умом или воспользоваться сервисами.

Ответить | Правка | Наверх | Cообщить модератору

12. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 11:59

Чтоб хоть как-то запустилось 128 Гб DDR5 ОЗУ.
Или можно одну NVIDIA H200.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

34. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 12:56

> Чтоб хоть как-то запустилось
И выдало хоть какие-то результаты.

Ответить | Правка | Наверх | Cообщить модератору

106. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:41

А оно хоть Doom запустит?

Ответить | Правка | К родителю #12 | Наверх | Cообщить модератору

13. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –4 +/–

Сообщение от Аноним (13), 17-Мрт-26, 12:02

Нужно было интересоваться до взлета цен на память. Купить максимум во все слоты по 32гб = 128гб. Да любая видяха пойдет. Я на интегрированной 8700G. Но модели 30-60гб юзаю (q6). Квен3-кодер-30b полюбился. Главная проблема - научиться общаться с ии. Придется слова учиться подбирать и вычищать промпт от "помогающих" инструкций. Модели от devstral ужасны. Европа загнила. Фантасмагорический язык они придумали, а компилятор или интерпретатор существует? Короче он нам и нафиг не нужон Ленстрал ваш. Вайбкодинг не существует, это протокол.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

29. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (29), 17-Мрт-26, 12:50

Вообще-то максимум для DDR5 4x48 Gb, но нужна поддержка процом и мамой.

Ответить | Правка | Наверх | Cообщить модератору

57. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +2 +/–

Сообщение от Аноним (4), 17-Мрт-26, 14:51

То замёрзла, то загнила, то ли дело у нас!

Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

126. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон (?), 18-Мрт-26, 12:34

GPT OSS даже 20b дает во все щели убогому квен, а так квен самые слабые модели.

Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

14. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +2 +/–

Сообщение от Андрей (??), 17-Мрт-26, 12:02

Вообще чем мощнее тем лучше, дальше по убыванию скорости генерации:
1) "вся модель должна влезть в VRAM" ->
2) "Часть модели влазит в VRAM, остальная часть помещается в RAM" ->
3) "Часть модели в VRAM, часть в RAM, часть в SSD swap(В случае MoE моделей на ура)
4) "Вся модель в RAM"
5) "Часть в RAM, часть в SWAP"
Короче дальше думаю ясно, по итогу ключевое наверное ограничение, это чтобы на базу и плотные слои(или активируемую часть экспертов) хватало по минимуму VRAM + RAM, тогда потыкать в разумных пределах можно любую модель, в противном случае - суета. На удивление для себя обнаружил(хотя и ожидал), что в ноут 8VRAM + 32RAM вполне влезла 80B MoE q6 модель, да ещё и работает на ~4 т/с, что вполне годно и по качеству и по скорости для автономной LLM, если бы ещё заморочится и переупорядочить экспертов(в пользу самых востребованных) и поколдовать с матричками активации, то так вообще космос будет.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

83. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (4), 17-Мрт-26, 17:40

А дальше уже всё будет ограниченно самим чипом, контроллером памяти и даже самой моделью:
https://signal65.com/wp-content/uploads/2025/03/chart01.webp

Ответить | Правка | Наверх | Cообщить модератору

17. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +3 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 12:06

В моделях как правило есть ещё B параметры (B = биллионы, миллиарды). Параметры — это веса нейронной сети: числа, которые хранятся в памяти и участвуют в вычислениях при каждом токене. Грубо: чем их больше, тем больше "знаний" и контекста модель может удерживать. 1B параметров ≈ 2 ГБ в памяти при float16, или ≈ 0.5 ГБ при 4-битной квантизации.
Важный нюанс про MoE (Mixture of Experts) — это как раз случай Leanstral/Devstral 2 в статье. Модель имеет 119B "всего" параметров, но активирует только 6.5B на каждый токен. Остальные "эксперты" в этот момент спят. Это значит, что вычислений меньше (скорость выше), но в памяти нужно держать всё равно почти все 119B — потому что неизвестно заранее, какой эксперт понадобится.
Железо: минимум и комфорт
Вот реальная картина по трём размерам моделей из этой истории:
Модель Devstral Small 2 24B dense, Apache 2.0 контекст 256K
Минимум RTX 3090 / 24 ГБ VRAM, Q4 квантизация, Mac 32 ГБ RAM, ~20 tok/s, контекст 32–57K
Хорошо работает RTX 4090 / 24 ГБ, RTX 3090 / 24 ГБ, AMD 6700 XT ×2 / 24 ГБ, ~44 tok/s (RTX 3090, Q4)
Комфортно RTX A6000 / 48 ГБ, Mac M3 Max / 96 ГБ, ~55 tok/s, полный контекст 256K
Devstral 2 (MoE), 123B / 6.5B активных, контекст 256K
Минимум 72+ ГБ VRAM, RTX 3090 ×4 или 4090 ×3, Q2 квантизация, Медленно, контекст 4–16K
Хорошо работает 96 ГБ unified RAM, Ryzen AI Max+ 395 96ГБ (~$1500), Mac M3/M4 Max 96 ГБ, Умеренно, контекст ~64K
Комфортно 128 ГБ unified RAM, RTX Pro 6000 Blackwell, Dual RTX 4090 48ГБ, Нормальная скорость, полный контекст
Вывод по железу:
Для Leanstral (119B MoE) локально — это уровень энтузиастов с бюджетом от $1500 только на железо: либо Ryzen AI Max+ 395 с 96 ГБ unified memory, либо Apple Silicon M3/M4 Max с 96–128 ГБ, либо несколько потребительских GPU в связке. На обычном домашнем ПК с одной видеокартой — не запустить.
Devstral Small 2 (24B) — другая история: одна RTX 3090/4090 справляется реально и выдаёт приемлемую скорость. Если сравнивать с Qwen2.5-Coder, который ты уже используешь — они в одной весовой категории, разница только в специализации (Devstral заточен под агентные задачи и тулколлинг).
Про модели в статье
Статья слегка путает названия: Leanstral и Devstral — это разные вещи. Leanstral — это специализированная модель именно под Lean 4 и формальную верификацию. Devstral — это общий coding-агент от Mistral. Судя по описанию (119B параметров, 6.5B активируемых) — речь о MoE-архитектуре, это скорее относится к Devstral 2 (123B).
Я ещё попросил составить по другим моделям ИИ чтоб он посчитал от дешевым к дорогим, минутку.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

54. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от booksy (?), 17-Мрт-26, 14:34

Всё чётко разложил. Что посоветуете на бюджет до 4500-5000 евро? Интересно именно кодинг и эта новая модель выглядит многообещающей.

Ответить | Правка | Наверх | Cообщить модератору

71. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 16:22

https://www.google.com/search?q=&hl=ru&aep=22&udm=50

Ответить | Правка | Наверх | Cообщить модератору

82. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (82), 17-Мрт-26, 17:36

> Что посоветуете на бюджет до 4500-5000 евро?
Openrouter. И найти работу.

Ответить | Правка | К родителю #54 | Наверх | Cообщить модератору

128. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон (?), 18-Мрт-26, 12:36

Кому этот хлам в 2026 сдался? Уже вагон сервисов с оплатой по сбп и дешевле раза в 2 бгггг

Ответить | Правка | Наверх | Cообщить модератору

134. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (134), 19-Мрт-26, 10:03

Дешевле это 1.5 тыщи за 1М токенов?

Ответить | Правка | Наверх | Cообщить модератору

127. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон (?), 18-Мрт-26, 12:35

routerai(dot)ru и кими к2,5

Ответить | Правка | К родителю #54 | Наверх | Cообщить модератору

146. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 02-Апр-26, 11:44

> Всё чётко разложил. Что посоветуете на бюджет до 4500-5000 евро? Интересно именно
> кодинг и эта новая модель выглядит многообещающей.
Я вот сейчас экспериментально разбираюсь. И тут люди, да и я обращают внимание на то что модель должна поместится в RAM, потом на видеокарте (или NPU, хоть он пишут что медленнее GPU работает, но быстрее CPU, даже если речь о оптимизированных моделей под NPU) активные параметры должны поместится в VRAM. Также я узнал что оказывается несколько ПК можно объединить в один кластер, но тогда нужна мощная сеть типа 10 гигабит/сек. Также кроме B параметров и MoE моделей там есть параметр квантизации - который влияет на точность и логику, глюки. Мне лично кажется что если для личной разработки, то это вряд-ли когда окупится и если это не для экспериментов которые могут закончится и не очень удачно, то посмотрите в сторону покупки сервисов, потому что это всё очень дорого.
Множество моделей поддерживают видеокарты NVidia, это самое дорогое в ПК на сегодняшний день. Хотя поддержка других видеокарт подтягивается, но там как правило почему-то нужно больше VRAM. И я рекомендую именно минимум 16Gb VRAM для дискретной (не встроенной видеокарты) потому что это минимум который необходим для генерации видео на Stable Diffusion на сегодняшний день и то не самая быстрая генерация. Поэтому советую именно это как минимум и да - ПК, а не ноутбук. На 16Gb вы точно можете получить быструю генерацию картинок. Касательно кода - поинтересуйтесь у ИИ сколько вы токенов на секунду получите на каком конкретном оборудовании. Комфортно вы себя будете чувствовать если это минимум 150-200 токенов/сек. В расширении Continue вы можете настроить модели под свой сервер, а нужно как минимум для чата и автодополнения, а если ещё и агентная работа будет хорошо работать, так зашибись. Память RAM как вы понимаете нужна для того чтобы ваша модель влезла туда вообще, да конечно кто-то уже советует что можно сделать большой своп, поэтому не забудьте раскошелиться на NVME в качестве жесткого диска. А учитывая что размеры моделей большие, то этот NVME должен быть большим и опять таки - минимум терабайт. И всё это должна поддерживать также какая-нибудь хорошая материнская плата. А если вы несколько таких ПК захотите объединить в кластер, то нужен ещё и хороший роутер с большой пропускной способностью.
Обычно когда люди сталкиваются с такими проблемами, которые в одиночку трудно решить, как правило они объединяются. Мне кажется что этот вопрос настолько сложный, что проще как-то найти людей которые одинаково думают и создать НКО - вам будет проще таким образом вместе скинуться на оборудование и совместно использовать и поддерживать. Как минимум там есть задача кодинга, задача генерации видео и аудио. Всё это должен кто-то поддерживать и не ломать голову. Это идеально на самом деле для интернет-компаний. Кроме предоставления услуг интернет, они могли бы предоставлять ещё и такие услуги за более скромную плату. Поэтому вы вообще подумайте над вариантами - нужно ли вам это или нет? А то я так с ходу захотел поумничать, а потом подумал - а вам оно нужно?

Ответить | Правка | К родителю #54 | Наверх | Cообщить модератору

18. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от geth (?), 17-Мрт-26, 12:09

На HF народ квантует. Пишут что:
Performance
On 2x RTX 4090 (48GB VRAM) + 192GB RAM with Q4_K_M:
~34 tokens/s generation speed
Model splits between GPU and system RAM automatically with -fit on
Т.е. 8 битное квантование будет примерно в 2 раза медленнее. А цены на 4090 и 5090 уточняйте у поставщиков, советую обращать внимание на китайцев с 48 Гб VRAM.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

70. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 16:18

Вредный совет, сколько уже людей обожглись на всяких PELADN и т.д.
Все эти подвальные рефабы с неизвестным ресурсом. Так что себе этих мутантов можете купить, но советовать другим это такое...

Ответить | Правка | Наверх | Cообщить модератору

72. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от geth (?), 17-Мрт-26, 16:23

Уговорили, тогда покупайте H200, делов на 30 минут.

Ответить | Правка | Наверх | Cообщить модератору

108. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Ванька с огорода (?), 17-Мрт-26, 21:35

не H200 конечно, но всяко дешевле чем nvidia или mac - https://www.kickstarter.com/projects/tiinyai/tiiny-ai-pocket...

Ответить | Правка | Наверх | Cообщить модератору

109. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 21:57

Есть сомнения в дешевизне т.к. его не получится подключать к дешманским ноутам.
В дешёвых ноутах нет Thunderbolt 3/4.

Ответить | Правка | Наверх | Cообщить модератору

92. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:42

> квантует
Квантизация сильно ухудшает умственные возможности моделей. Даже если в бенчмарках заявляется о потери 1% производительности, на деле же там все 50%. Проверено лично на собственном проекте, тестируя fp4 и fp8 варианты одной модели.

Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

21. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +4 +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 12:18

Данные свежие, март 2026. Строю большую сводную таблицу по тирам.
Тир 0 — CPU / интегрированная графика
Любой ноутбук или ПК с 8–16 ГБ RAM, без дискретного GPU.
Qwen 3.5 4B (Q4, ~3 ГБ RAM) — минимально жизнеспособный кодинг-ассистент на CPU или интегрированной графике. Мышление включается по запросу. Хорош для объяснений и простых задач. Скорость 5–10 tok/s на CPU, контекст 32K.
Phi-4-mini (3.8B, Q4, ~2.5 ГБ) — от Microsoft, сильный интеллект для размера. MMLU 68.5 — лучший в классе до 4B. Хорош для math/logic. Слабоват на длинном коде. Скорость 10–20 tok/s на CPU, контекст 16K.
Llama 3.2 3B (Q4, ~2 ГБ) — от Meta, оптимизирован для edge/mobile. Хорош для chat, суммаризации. Не специализирован на коде. Скорость 8–15 tok/s на CPU, контекст 128K.
Тир 1 — 8 ГБ VRAM
RTX 3070 / 4060 / RX 7600 XT, около $300–500 за GPU.
Qwen 2.5 Coder 7B (Q4, ~6.6 ГБ) — лучший FIM-автокомплит в классе до 8B. HumanEval 88.4%, 128K контекст, 92+ языка. Основа для inline autocomplete в редакторе. Скорость 30–50 tok/s, контекст 128K.
Qwen 3.5 9B (Q4, ~7 ГБ) — вышел 2 марта 2026. Мультимодальный (читает изображения), thinking mode. LiveCodeBench 65.6. Хорош для чата и ревью кода рядом с автокомплитом. Скорость 25–40 tok/s, контекст 262K.
Gemma 3 9B (Q4, ~6 ГБ) — от Google, сильный general-purpose. Хорошее reasoning, мультилингвальность. Apache 2.0. Хуже на чистом коде, чем Qwen. Скорость 30–45 tok/s, контекст 128K.
Тир 2 — 12–16 ГБ VRAM
RTX 4070 / 3080 Ti / RX 7800 XT, около $500–800 за GPU.
Qwen 2.5 Coder 14B (Q4, ~10 ГБ) — значительно сильнее 7B на многошаговых задачах. Всё ещё лучший FIM. Хороший выбор для daily driver кодинга. Скорость 20–35 tok/s, контекст 128K.
DeepSeek-R1-Distill 14B (Q4, ~10 ГБ) — дистилляция R1 от DeepSeek. Цепочка рассуждений, сильный на debug и math. Медленнее из-за thinking-токенов, но заметно умнее на сложных задачах. Скорость 15–25 tok/s, контекст 64K.
Phi-4 14B (Q5, ~11 ГБ) — от Microsoft, MMLU 76.2. Отличное reasoning и math для размера. Конкурирует с моделями втрое больше. Скорость 20–30 tok/s, контекст 16K.
Gemma 3 12B (Q4, ~8 ГБ) — лучший general-purpose в 12B классе по мнению многих. Хорошо на мультилингвале, суммаризации, code review. Скорость 25–40 tok/s, контекст 128K.
Тир 3 — 24 ГБ VRAM
RTX 3090 / 4090 / RX 7900 XTX, около $700–2000 за GPU.
Qwen 2.5 Coder 32B (Q4, ~20 ГБ) — топ для кодинга на одной потребительской карте. SWE-bench 43.4%. Хороший для больших проектов и рефакторинга. Скорость 20–35 tok/s, контекст 128K.
GLM-4.7-Flash (Q4, ~18 ГБ) — от Zhipu AI. Intelligence Index 30.1 — лучший all-rounder на 24 ГБ по тестам 2026. Победитель agentic coding challenge на localllm.in. Сильный на математике. Скорость 25–40 tok/s, контекст 128K.
DeepSeek-R1-Distill 32B (Q4, ~20 ГБ) — самый сильный reasoning на одной 24GB карте. Цепочка мыслей, math, сложный debug. Медленнее из-за thinking. Скорость 12–20 tok/s, контекст 64K.
Devstral Small 2 (24B) (Q4, ~14 ГБ) — от Mistral, специализирован на агентном кодинге и тулколлинге. SWE-bench 68%. Apache 2.0. Та самая модель из статьи выше. Скорость 44 tok/s на RTX 3090, контекст 256K.
Gemma 3 27B (Q4, ~16 ГБ) — лучший general от Google для 24 ГБ. Мультимодальный, хороший на длинных документах и мультилингвале. Скорость 20–30 tok/s, контекст 128K.
Тир 4 — 48+ ГБ VRAM или unified 96 ГБ
RTX A6000 / 2×RTX 3090 / RTX 5090 / Mac M3 Max 96 ГБ / Ryzen AI Max+ 395. Цена от $1500 до $5000+.
Llama 3.3 70B (Q4, ~40 ГБ) — от Meta, огромная экосистема fine-tune и тулинга. Хороший general + code. Нужно 48 ГБ VRAM или 2×24 ГБ. Скорость 15–25 tok/s, контекст 128K.
Qwen3-Coder-Next (80B MoE) (Q4, ~46 ГБ RAM) — от Alibaba, вышел февраль 2026. Первое место на SWE-rebench (64.6%), обходит Claude Opus 4.6 (58.3%). Всего 3B активных параметров — высокая скорость для класса. Нужно 46 ГБ unified memory или VRAM+RAM с offload. Скорость 20–40 tok/s, контекст 256K.
Devstral 2 (123B MoE) (Q2, 72+ ГБ VRAM) — из статьи выше. SWE-bench 72.2%. Нужно минимум 72 ГБ VRAM или 96 ГБ unified memory для нормальной работы. Скорость 10–20 tok/s, контекст 256K.
GPT-oss 20B (Q4, ~14 ГБ) — утёкшая open-weight модель от OpenAI. Сильное reasoning и tool-calling. Помещается на 24 ГБ, но раскрывается на большем железе с длинным контекстом. Скорость 25–35 tok/s, контекст 128K.
Тир 5 — экстремальное железо
128+ ГБ unified memory, multi-GPU, Mac M3 Ultra 512 ГБ. Цена $5000 и выше.
Qwen3-Coder 480B (Q2, ~276 ГБ) — аналог Claude Sonnet 4 по кодингу (Aider Polyglot 60.9% против 61.8% у полной точности). 35B активных параметров. Нужен кластер или Mac Ultra. Скорость 5–15 tok/s, контекст 1M токен.
DeepSeek V3.2 (685B MoE) (~200+ ГБ) — лучший open general-purpose на данный момент. SWE-bench 70.2%. Для домашнего запуска нужен Mac Ultra 512 ГБ или multi-GPU сервер. Скорость 3–10 tok/s, контекст 64K.
Самое интересное открытие из поиска — Qwen3-Coder-Next (80B MoE, 3B активных параметров) занял первое место на SWE-rebench с результатом 64.6%, обходя Claude Opus 4.6 (58.3%), GPT-5.2-medium (60.4%) и Gemini 3 Pro (58.3%). И при этом для запуска нужно всего около 46 ГБ RAM или unified memory в 4-битной квантизации.
По стратегии на 24 ГБ: Рекомендуемая связка — Qwen 2.5 Coder 7B для автокомплита (FIM), и Qwen 3.5 9B отдельно для чата, дебага и ревью кода — они не обязаны работать одновременно.
По Mac Mini как варианту: M4 Pro с 64 ГБ RAM запускает Qwen 2.5 Coder 32B на 11–12 tok/s — достаточно для production-задач. Четыре Mac Mini M4 в кластере (~$2400 суммарно) дают 496 ГБ unified memory и запускают даже Nemotron-70B.
По AMD: ROCm продолжает нагонять NVIDIA в поддержке llama.cpp и vLLM, но пока отстаёт. Radeon PRO W7900 с 48 ГБ стоит около $3500, потребительский RX 7900 XTX с 24 ГБ — ближайший вариант, но совместимость с ROCm нужно проверять под конкретную задачу.
Дополнительные заметки:
Стратегия на 24 ГБ — держать две модели по очереди: Qwen 2.5 Coder 7B для inline autocomplete (FIM) и Qwen 3.5 9B для чата и ревью. Они не обязаны работать одновременно.
Mac Mini M4 Pro с 64 ГБ RAM запускает Qwen 2.5 Coder 32B на 11–12 tok/s — достаточно для production. Четыре Mac Mini M4 в кластере (~$2400) дают 496 ГБ unified memory и тянут даже Nemotron-70B.
AMD ROCm продолжает нагонять NVIDIA в поддержке llama.cpp и vLLM, но пока отстаёт. RX 7900 XTX с 24 ГБ — ближайший потребительский аналог RTX 3090, совместимость с ROCm нужно проверять под конкретную задачу.
Квантизация Q4_K_M — золотой стандарт: уменьшает размер модели на ~75% с минимальной потерей качества. Для большинства задач неотличима от полной точности.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

60. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (59), 17-Мрт-26, 15:28

Спасибо!

Ответить | Правка | Наверх | Cообщить модератору

65. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 16:07

Вы тоже самое можете спрашивать из чатов, как он и сделал:
1) https://www.google.com/search?q=&hl=ru&aep=22&udm=50
2) https://www.perplexity.ai

Ответить | Правка | Наверх | Cообщить модератору

96. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:28

> Спасибо!
Имей в виду что знания ИИ обновляются раз в год. Поэтому модели реально можно посмотреть более новые когда купите железо и поэксперементировать может оно поддерживает что-то лучше чем предложило ИИ. Даже не взирая на то что оно поискало свежую информацию, все-равно стоит самому поискать, может найдете для себя что-то лучше.

Ответить | Правка | К родителю #60 | Наверх | Cообщить модератору

97. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 20:31

> Спасибо!
И да, не грузите несколько больших моделей в память одновременно если не влезет - впечатление может быть не верным. Вроде бы логично их грузить в память по мере надобности, но далеко не все производители софта так думают и предупреждают.

Ответить | Правка | К родителю #60 | Наверх | Cообщить модератору

66. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (66), 17-Мрт-26, 16:08

Чтобы нормально работать вся модель должна влазьть в VRAM, а RAM брать в дваразы больше: RAM = 2 * VRAM.
Важно скорость работы VRAM и вычислительная способность видяхи в int8/s - больше значит лучше.

В топовую видяху, сабжевая модель в память уже не влазит:
Nvidia RTX PRO 6000 Workstation Edition Blackwell; 96GB DDR7 ECC; 1024 TOPS (Int8); -600W; PCI-E 5.0 x16

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

69. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 16:12

NVIDIA H200

Ответить | Правка | Наверх | Cообщить модератору

77. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (66), 17-Мрт-26, 17:12

> NVIDIA H200
Посмотрел спеки на H200 NVL:
VRAM - 141GB
int8 - 3.3 PFLOPS (така видяшка и в TOP500 может попасть)
VRAM HBM3E- 4.8TB/s
Видяшку можно дробить аж на 7 мелких виртуальных
Или можно объединять вплоть до 8 видеокарт в одну большую виртуальную:
2- or 4-way NVIDIA NVLink bridge: 900GB/s per GPU
PCIe Gen5: 128GB/s

Ответить | Правка | Наверх | Cообщить модератору

80. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 17:26

>така видяшка и в TOP500 может попасть
Ну нет, там совсем другая точность. В топовых кластерах тысячи таких H200 установлено помимо CPU.

Ответить | Правка | Наверх | Cообщить модератору

117. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от vibecoder (?), 18-Мрт-26, 06:39

Никто не использует видеокарты вне дата-центров для запуска LLM. У нас в компании разорились на три Mac Studio и гоняем GLM-5 с очень приличной скоростью инференса.

Ответить | Правка | К родителю #66 | Наверх | Cообщить модератору

118. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (118), 18-Мрт-26, 08:50

> три Mac Studio
Сравни скорость памяти и скорость вычислений int8.
> для запуска LLM
Для запуска чужой готовой модели мощностей современных CPU хватит, а для обучения тюнинга своей LLM альтернативы видяхи нет. И здесь привлекательны десктопные модели, к которым можно мониторы подключать. Через года 2-4 поставить старую видяху на десктоп и купить новую.
Пол годаа наза собирал, не взяли, оставлю для сравнения железа и цены (int8 4.5 PFLOPS):
=Case=
# [https://ipc.in-win.com/pedestal-tower-iw-plg-gpu-tower In-Win IW-PLG] 9 expansion slots supporting up to 4 x full-height, full-length, double-width GPU cards; ATX(12" x 9.6"), CEB(12" x 10.5"), EEB(12" x 13"), Mini-SAS HD (SFF-8643), 12Gbps supported x 3 (pre-installed x 2), SAS3 12Gb/s
PCle Gen4 16GT/s

==PSU Titanium CRPS==
# 2 x [https://www.senaonetworks.com/en/products/power-supply/titan.../ Senao Titanium CRPS (2000W)] ERAB0-CTA-BF; 500$

==Rear fan for GPU==
# [ In-Win Rear fan kit for GPU thermal, 80x38mm, 8300RPM] 2RAKID079800

==Rack mounting ear==
# [ In-Win Rack mounting ear (L)] 2RAKIS232800
# [ In-Win Rack mounting ear (R)] 2RAKIS232900

==Slide rails==
# 2 x [ In-Win 28" tool-less & ball-bearing slide rails (weight capacity 60kg)] 3RAMIS152700

==MB==
# [https://www.asus.com/motherboards-components/motherboards/wo.../ ASUS Pro WS W790E-SAGE SE] LGA4677; EEB;  6 x PCI-E x16; 2TB 8 x R-DIMM DDR5 6800 ECC; 2 x 10GbE; 3 x M.2; USB 3.2 Gen 2x2 Type-C; 2 x SlimSAS; IPMI LAN AST2600 BMC; ~1000$

===CPU Xeon===
# [https://www.intel.com/content/www/us/en/products/sku/233483/... Intel® Xeon® w9-3495X Processor 105M Cache, 1.90 GHz] FCLGA4677; P Cores 56; DDR5 4800; PCI-E 5.0 120; 7nm; 420W; 5889$

===RAM  R-DIMM DDR5 6800 ECC 256GB===
# 8 x  [
====2 x RAM Heatsink====
# [https://easycargo.hk/product/laptop-ram-heatsink-pre-applied.../ Easycargo R-DIMM DDR5 RAM Heatsink Kit] 10 $

===GPU===
# 4 x  [https://www.nvidia.com/en-us/products/workstations/professio.../ Nvidia RTX PRO 6000 Workstation Edition] Blackwell; 96GB DDR7 ECC; 1024 TOPS (Int8); -600W; PCI-E 5.0 x16; H.264; H.265; AV1; DirectX 12; Vulkan 1.4; OpenGL 4.6; OpenCL 3.0; 7680 x 4320@240Hz; 4 x DP2.1
От него потом уши с салазками открутить, 3 видяшки раздать одну оставить и через 5-10 лет офигенный десктоп будет.

Ответить | Правка | Наверх | Cообщить модератору

121. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аналоговнет (-), 18-Мрт-26, 10:03

Он прав. Мак ты всегда продаш по очень ликвидной цене. А вот твоё б\у GPU нафиг никому не нужно, к тому же специализированное типа H200.
> Для запуска чужой готовой модели мощностей современных CPU хватит
С какой скоростью? Простите, но вы глупость пишете, особенно в контексте использования в компании с более чем двумя программистами одновременно и без квантизации.

Ответить | Правка | Наверх | Cообщить модератору

124. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (124), 18-Мрт-26, 11:00

CPU сегодня от видях не сильно отстаёт:
Intel® Xeon® 6980P Processor
504M Cache, 2.00 GHz; FCLGA7529; P Cores 48 + E Cores 80, MRDIMM(8800MT/s), PCI-E 5.0 96; 3nm; 500W; 12460$
По скорости вычислений int8:
Xeon® 6980P = 2/3 * RTX PRO 6000 Workstation Edition

Ответить | Правка | Наверх | Cообщить модератору

125. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (-), 18-Мрт-26, 11:12

> CPU сегодня от видях не сильно отстаёт:
Память, шина и прочие бутылочные горлышки учитываются в вашем расчёте?

Ответить | Правка | Наверх | Cообщить модератору

131. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (131), 18-Мрт-26, 17:19

Да учитывается.
Xeon® 6980P - производительность в 838 TOPS int8 подтверждена независимыми тестами!
RTX PRO 6000 Workstation Edition производительность в 1024 TOPS int8 заявлена официально производителем.
Для сравнения оставлю:
Core™ Ultra 9 Processor 285K:
CPU - 36 TOPS (Int8) это суммарная всех 24 ядер со всеми потоками!
GPU - 8 TOPS (Int8)
NPU - 12 TOPS (Int8)
Итого максимум всего - 56 TOPS (Int8)
Intel® Arc™ Pro B60 Graphics Xe2; 2.4GHz; 24 GB GDDR6; 197 TOPS (Int8); 120-200W
AMD Radeon™ AI PRO R9700 RDNA™ 4; 2.92GHz; 32 GB GDDR6 ECC; 383 TOPS (Int8); -300W
То есть в производительности int8 примерно имеем:
Xeon® 6980P ~ 2/3 * RTX PRO 6000 Workstation Edition ~ 2 * Radeon™ AI PRO R9700 ~ 4 * Arc™ Pro B60 Graphics Xe2
Дальше надо смотреть PCIE 5.0 шину. Все что идёт через нее тормозит 128Gb/s.
Карточки Nvidia PRO можно соединятьтмежду собой интерфейсом 900Gb/s
Пооц Xeon® 6980P может тянуть RAM на скорости 8.8 T/s, но для него матплаты не нашел такой быстрой, может уже появились.

Ответить | Правка | Наверх | Cообщить модератору

137. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от vibecoder (?), 20-Мрт-26, 08:38

Только вот int8 это овощ. Минимум fp8, а лучше bf16. Вопреки бэнчмаркам, на реальных проектах разница катастрофическая между fp8 и int8 (до 40% ухудшение).

Ответить | Правка | К родителю #125 | Наверх | Cообщить модератору

122. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аналоговнет (-), 18-Мрт-26, 10:05

P.S. Вдогонку, обучать и тюнить модель выгоднее на облачном сервисе, где ты арендуешь топовые GPU для этой цели с почасовой оплатой. Свою покупать под это дело - глупость.

Ответить | Правка | К родителю #118 | Наверх | Cообщить модератору

68. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от nagual (ok), 17-Мрт-26, 16:10

Вообще железо нужно мощьное, но облачный сервис всегда будет дешевле, + скидки + акции + пробные периоды на новые модели.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

107. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Анонисссм (?), 17-Мрт-26, 21:08

>какое железо нужно, чтобы запустить
"запустить" любой ПК с 128ГБ ОЗУ без ГПУ.
я например на арендованных топовых райзенах с 128ГБ тестирую gpt-oss 120b и qwen-coder 122b. неспешно, но вполне быстро что-то колбасит. лично меня качество кода не устраивает и у моделей на 80ГБ. облачный sonnet/opus лучше, чтобы там в тестах не рисовали

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

2. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 17-Мрт-26, 11:34

> В проведённых тестах модель Leanstral ощутимо обогнала существующие открытые модели Qwen3.5 397B-A17B, Kimi-K2.5 1T-A32B и GLM5 744B-A40B, показала сходные результаты с моделями Claude Haiku 4.5 и Claude Sonnet 4.6 от компании Anthropic, но отстала от модели Claude Opus 4.6.
О, это уже не плохо. Sonnet 4 уже хорош, а 4.5 немного лучше. 4.6 там не особо то и сильно лучше. Если проверять что оно пишет, то 4.5 уже отличная помощь.

Ответить | Правка | Наверх | Cообщить модератору

8. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +8 +/–

Сообщение от Аноним (-), 17-Мрт-26, 11:48

> AI-модель для вайб-кодинга с формальной верификацией
Хихи, маркетологи нынче зажигают на тему взаимоисключающих параграфов.

Ответить | Правка | Наверх | Cообщить модератору

10. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (10), 17-Мрт-26, 11:53

> Хихи, маркетологи нынче зажигают на тему взаимоисключающих параграфов.
А где противоречие? Модель просто обучили в том числе на ошибках Aeneas.
Модель выдает код, агент запускает верификатор, тот выдает какие-то ошибки, которые модель обрабатывает и исправляет код. После этого верификатор запускается повторно.
Обычный close loop.

Ответить | Правка | Наверх | Cообщить модератору

15. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (15), 17-Мрт-26, 12:03

В итоге, модель научится писать код, проходящий конкретный верификатор. А вовсе не нормально работающий

Ответить | Правка | Наверх | Cообщить модератору

16. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (16), 17-Мрт-26, 12:06

> В итоге, модель научится писать код, проходящий конкретный верификатор.
> А вовсе не нормально работающий
Если "не нормально работающий" код проходит ваш верификатор... то проблема в верификаторе.
Потому что сам факт прохождения верификации должен давать гарантии соответствия спецификации.

Ответить | Правка | Наверх | Cообщить модератору

20. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +3 +/–

Сообщение от Хрю (?), 17-Мрт-26, 12:17

Вся проблема, что написать полностью правильную верификацию на код, не проще чем этот код написать 😃 Т.е. одну сложность заменили на другую 😃

Ответить | Правка | Наверх | Cообщить модератору

27. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (-), 17-Мрт-26, 12:46

вот только сначала тебе в норме надо было написать и код верификации, и код под нее
а сейчас надо написать верификацию, код нейробратан напишет
не одну "сложность заменили на другую", а уполовинили сложность

Ответить | Правка | Наверх | Cообщить модератору

28. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Хрю (?), 17-Мрт-26, 12:50

Сейчас верификацию на код пишут, мягко скажем очень редко, и в мегакритикал системах, потому что это тяжёлая, сложная и очень затратная операция с малым колвом спецов по теме и небольшим колвом специального ПО. Гораздо проще и дешевле тупо написать код и облажить его тестами.

Ответить | Правка | Наверх | Cообщить модератору

32. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (-), 17-Мрт-26, 12:55

тогда о чем разговор? у нас нет верификатора, потому мы хотим, чтобы модель, заточенная на работу через верификатор, без него код написала? или что?

Ответить | Правка | Наверх | Cообщить модератору

38. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Хрю (?), 17-Мрт-26, 13:03

Разговор про то что дешевле и лучше не стало, а просто одну сложность 'написание кода', заменили на другую сложность (возможно даже более сложную) 'написание верификатора'. Я пока вижу очень узкую сферу применения сей модели к этому и был изначальный каммент.

Ответить | Правка | Наверх | Cообщить модератору

40. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (-), 17-Мрт-26, 13:05

> Разговор про то что дешевле и лучше не стало
> Я пока вижу очень узкую сферу применения сей модели
Дак стало или нет?
А там, где писали верификацию, стало легче или нет?
Или раз никто не пишет верификацию, то это нормально и верификацию писать не нужно?

Ответить | Правка | Наверх | Cообщить модератору

46. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Хрю (?), 17-Мрт-26, 13:42

Верификацию пишут для всяких контроллеров и т.п. критикал вещей, там не только нужна правильность, а так же real time, ограниченные ресурсы и т.п. вопросы. Способна ли эта модель всё это учесть? Очень сомнительно, отсюда и скепсис.
Сейчас очень много игр в верификацию. Т.е. она заявляется много об этом трубится, но используется на самом деле очень и очень ограниченно. Моё мнение, что эти модели из той же серии "давайте поиграем в серьёзных дяденек".

Ответить | Правка | Наверх | Cообщить модератору

63. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (-), 17-Мрт-26, 16:03

> Верификацию пишут для всяких контроллеров и т.п. критикал вещей, там не только нужна правильность, а так же real time, ограниченные ресурсы и т.п. вопросы
я очень рад, что ты признаешь, что есть сферы, где верификация очень важна
> Способна ли эта модель всё это учесть? Очень сомнительно
это не сложно проверить - цены приведены в новости, прогон теста стоит меньше похода в магазин за едой на пару дней, а зачит написать что-то будет еще дешевле
ну и да, сначала ты пишешь про то, что оно не нужно, а теперь, что модель что то там не способна
нужно или не нужно верифицировать? способна или не способна модель?
> Т.е. она заявляется много об этом трубится, но используется на самом деле очень и очень ограниченно
я рад, что ты признаешь, что она используется, но лучше бы ты сказал, хорошо это или плохо, что очень ограничено
> Моё мнение, что эти модели из той же серии "давайте поиграем в серьёзных дяденек".
это про все современное IT так можно сказать, а то куда это серьезные дяденьки то без IT то в конторе

Ответить | Правка | Наверх | Cообщить модератору

37. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (37), 17-Мрт-26, 13:02

облАжить тестами - это зачЁт!

Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

30. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (30), 17-Мрт-26, 12:51

> не одну "сложность заменили на другую", а уполовинили сложность
Нюанс в том, что 99% 6ыdlo-кодеров никогда в жизни не писали спецификаций.
Максимум смотрели в AC в задачке, которые выдавил из себе менеджер, и где-то в голове прикидывали эджкейсы. Ну, могли еще комментарий в коде оставить "вот тут может произойти такая х..., поэтому делаем так-то"

Ответить | Правка | К родителю #27 | Наверх | Cообщить модератору

35. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (-), 17-Мрт-26, 12:56

вот то же самое
тогда о чем разговор? у нас нет верификатора, потому мы хотим, чтобы модель, заточенная на работу через верификатор, без него код написала? или что?

Ответить | Правка | Наверх | Cообщить модератору

47. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –2 +/–

Сообщение от aname (ok), 17-Мрт-26, 13:45

Анонимные эксперты с опеннета хотят, чтоб за них всё делала нейрослопть, а они сидели и получали 300kk/наносекунду.
Весь дев должен, по- хорошему, отталкиваться от ТЗ, от правил о ограничений, в виде верификации, но по сложившимся причинам, такое делают настолько редко, что аж пришлось придумывать целый ЯЗЫК погроммирования, чтоб обучившиеся на курсах разного уровня качества могли выдавать код, хотя бы, без вылезания за границы буффера.
Mistral всё, же, идёт в правильном направлении: разрабатывайте условия, а накодить может хоть биоединица, хоть цифровая.
Но анонимным экспертам с опеннета, привыкшим к хелло ворлдам библиотеки подключать, такое сложно, да.

Ответить | Правка | Наверх | Cообщить модератору

94. Скрыто модератором +1 +/–

Сообщение от Аноним (92), 17-Мрт-26, 20:02

> Анонимные эксперты с опеннета хотят, чтоб за них всё делала нейрослопть, а они сидели и получали 300kk/наносекунду.
Не эксперт, но получаю прилично, сделав арбитражного бота для Polymarket и заработал уже на новый авто из салона с прошлой весны, причем не умея в математику и чего-то более сложного, чем хеллоуворлд на 100 строк вообще. До этого 10 лет перебивался непостоянными заработками и по вахтам. Так что да, я в выигрыше, а ты, как нОстОясчЫй пОгромист - в проигрыше, и я даже рад позлорадствовать ;)

Ответить | Правка | Наверх | Cообщить модератору

103. Скрыто модератором +/–

Сообщение от aname (ok), 17-Мрт-26, 20:39

Верю, конечно же я верю.

Ответить | Правка | Наверх | Cообщить модератору

51. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (51), 17-Мрт-26, 13:51

> В итоге, модель научится писать код, проходящий конкретный верификатор
По-моему, ты путаешь формальную верификацию со статическим анализом. Формальная верификация не зависит от "конкретного верификатора", ибо код либо математически корректен, либо нет. Если один верификатор пропускает код, который второй верификатор посчитал некорректным - значит, в первом верификаторе баг.

Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору

39. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 13:03

> ошибки, которые модель обрабатывает и исправляет код. После этого верификатор запускается повторно
Но есть нюанс: процесс не обязан сходиться. Практика применения ИИ показывает, что 1+1 нейроslop ещё может научиться складывать, а более сложное - постоянно в ошибках.

Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

48. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от aname (ok), 17-Мрт-26, 13:46

Что значит "не обязан сходится"?
Практика применения ИИ показывает, что от людей ИИ тупеет, и какие выводы из этого сделаем?

Ответить | Правка | Наверх | Cообщить модератору

55. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 14:37

С такими вопросами - к математикам, но они от ИИ тупеют, от того самого, который отупел.

Ответить | Правка | Наверх | Cообщить модератору

58. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (58), 17-Мрт-26, 15:19

//www.youtube.com/watch?v=JHEO7cplfk8
Вот наглядное пособие, приглядитесь по внимательней и сделайте вывод в качестве чего используется в данном контексте ЫЫ?

Ответить | Правка | Наверх | Cообщить модератору

64. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (64), 17-Мрт-26, 16:06

>Но есть нюанс: процесс не обязан сходиться
Какой процесс у тебя там не сходится? Верификация должна гарантировать соответствие спецификации. Всё. Сдается мне, что ты не в курсе, что такое верификация.
>1+1 нейроslop ещё может научиться складывать, а более сложное - постоянно в ошибках
А, ты и про ИИ не в курсе. Понятно всё.

Ответить | Правка | К родителю #39 | Наверх | Cообщить модератору

81. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 17:35

Чем отличается верификация от имплементации - тебе надо рассказывать?

Ответить | Правка | Наверх | Cообщить модератору

114. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от anonymos (?), 18-Мрт-26, 03:51

Мне надо.
Расскажи, будь ласка )

Ответить | Правка | Наверх | Cообщить модератору

93. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:58

> Практика применения ИИ показывает, что 1+1 нейроslop ещё может научиться складывать, а более сложное - постоянно в ошибках.
Да вы батенька бред несете. Ну или ваша "практика" это модели из 2023 года.

Ответить | Правка | К родителю #39 | Наверх | Cообщить модератору

11. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (11), 17-Мрт-26, 11:59

Нейрослоп вышел на новый уровень.

Ответить | Правка | Наверх | Cообщить модератору

41. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 13:08

Вангуется очередное повышение цен на память в 2 раза.

Ответить | Правка | Наверх | Cообщить модератору

44. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (4), 17-Мрт-26, 13:13

Ими кстати ASML заинтересовались:
https://www.asml.com/en/news/press-releases/2025/asml-mistra...

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

90. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:35

> Нейрослоп
Слоп остался в 2023 году. Нынче нейронка в большинстве случаев генерирует более качественный код, чем человек. Другое дело, что полностью ей доверять нельзя и все равно нужно руками потом переписывать (в 90% случаев - упрощать её Ынтерпрайзные паттерны).

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

142. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от анон (?), 25-Мрт-26, 12:41

привет, сатья наделла. тебя действительно настолько задевает корень слоп?

Ответить | Правка | Наверх | Cообщить модератору

22. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +4 +/–

Сообщение от Аноним (22), 17-Мрт-26, 12:20

> позволяет подтвердить, что сгенерированный AI-моделью код делает именно то, что задумано
Осталось теперь подтвердить, что описанное в спецификации - это именно то, что и было задумано

Ответить | Правка | Наверх | Cообщить модератору

49. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от aname (ok), 17-Мрт-26, 13:48

Ну если условные "вы" не способны написать спецификации, то тут не только нейрослопть бессильна, тут даже у медицины на этом полномочия всё.

Ответить | Правка | Наверх | Cообщить модератору

62. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (58), 17-Мрт-26, 15:32

> Ну если условные "вы" не способны написать спецификации, то тут не только
> нейрослопть бессильна, тут даже у медицины на этом полномочия всё.
//www.youtube.com/watch?v=JHEO7cplfk8
Ну вот, чем, по вашему, тут занята ЫЫ?

Ответить | Правка | Наверх | Cообщить модератору

78. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от aname (ok), 17-Мрт-26, 17:13

>> Ну если условные "вы" не способны написать спецификации, то тут не только
>> нейрослопть бессильна, тут даже у медицины на этом полномочия всё.
> //www.youtube.com/watch?v=JHEO7cplfk8
> Ну вот, чем, по вашему, тут занята ЫЫ?
Главное, что понаделал кожаный мешок

Ответить | Правка | Наверх | Cообщить модератору

84. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (58), 17-Мрт-26, 17:58

ну так чем там занята ЫЫ?

Ответить | Правка | Наверх | Cообщить модератору

105. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от aname (ok), 17-Мрт-26, 20:40

> ну так чем там занята ЫЫ?
Писала коммент, на который я сейчас отвечаю

Ответить | Правка | Наверх | Cообщить модератору

110. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (58), 17-Мрт-26, 22:54

ч. и. т. д.

Ответить | Правка | Наверх | Cообщить модератору

74. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +2 +/–

Сообщение от Аноним (73), 17-Мрт-26, 16:32

Вы совершенно правы, я ошиблась в спецификации - ваш рентгеновский аппарат совершенно точно не должен выжигать пациентам суставы в порошок, так что вот вам новая, исправленная, спецификация.

Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

31. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (34), 17-Мрт-26, 12:53

> математического доказательства корректности
не гарантирует, что код оптимальный. Чтобы получить "единицу", можно сделать 0+1, а можно сумму квадратов косинуса и синуса, разложенных в ряды, вычисляемых через soft-float повышенной разрядности, от случайного аргумента, полученного криптографически через энтропию устройств ввода-вывода системы.

Ответить | Правка | Наверх | Cообщить модератору

36. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –2 +/–

Сообщение от Аноним (36), 17-Мрт-26, 13:02

> не гарантирует, что код оптимальный
А мясной мешок гарантирует оптимальность?))
Ну и какую именно оптимальность?
По памяти? По вычислениям? По минимальности операций для fpu?
Вы вначале сформулируйте требования.

Ответить | Правка | Наверх | Cообщить модератору

61. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (58), 17-Мрт-26, 15:30

> Вы вначале сформулируйте требования.
Ну вот с этого надо и начинать, это равносильно понятию эффективно вычислимой функции (нормальному алгорифму) во времена Черча, Тьюринга, Поста, Маркова.

Ответить | Правка | Наверх | Cообщить модератору

88. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +1 +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:32

> А мясной мешок гарантирует оптимальность?))
Мясной мешок держит в голове контекст длиною в жизнь, и знает в каких случаях оптимально то или иное решение (если это не стажёр или джун).

Ответить | Правка | К родителю #36 | Наверх | Cообщить модератору

133. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (133), 19-Мрт-26, 08:36

Животное, все эти ИИ сделаны человеком. ты и тебе подобные так орут, словно ИИ сделал себя сам. Буквально пару дней назад эта чепуха даже не распарсила версию ядра из результата выполнения uname -r. "Доооооо, ЫЫ заменит всех!!!1!11!"

Ответить | Правка | К родителю #36 | Наверх | Cообщить модератору

50. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –2 +/–

Сообщение от aname (ok), 17-Мрт-26, 13:51

Ну так критерии оптимальности, для начала, завезите.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

43. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +3 +/–

Сообщение от Bob (??), 17-Мрт-26, 13:12

Вайбкод:
1) модель тренировали на общедоступном мусоре, а не топовых примерах кода и коммерческом софте
2) задача максимум токенов "сожрать/выплюнуть" - чтобы платили
3) общение напоминает диалог глухо-немого со слепым
4) в тесте не учли человекочасы на годный результат

Ответить | Правка | Наверх | Cообщить модератору

86. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +3 +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:29

Ты ошибаешься, модели тренируют как раз на Ынтерпрайзном коде, отсюда и берутся хеллоуворлды с клиент-серверными архитектурами на boot spring. Вместо простой функции, модель в большинстве случаев пишет 100500 абстракций, даже если это нафиг не нужно.

Ответить | Правка | Наверх | Cообщить модератору

135. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Аноним (134), 19-Мрт-26, 10:14

Про человекочасы тут зависит от опыта работы и задачи. Прототип или proof of work, тут экономит реально месяцы, реализовал беговой трекер на андроид за день, при том что я не знаю котлина и джавы и он даже работает. Про продакшн код, тут наверное раза в два-три быстрее за счёт того что ты пишешь код, а оно ревьюит и уже покрывает сразу тестами и доками.

Ответить | Правка | К родителю #43 | Наверх | Cообщить модератору

139. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (139), 21-Мрт-26, 09:50

> при том что я не знаю котлина и джавы
И откуда уверенность, что
> он даже работает
?

Ответить | Правка | Наверх | Cообщить модератору

85. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +5 +/–

Сообщение от Аноним (92), 17-Мрт-26, 19:28

Современные AI итак генерируют *синтаксически* верный код в 99% случаев. Проблема в логических и архитектурных решениях.

Ответить | Правка | Наверх | Cообщить модератору

136. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (134), 19-Мрт-26, 10:14

Ну так прокладка в виде человека для чего нужна?

Ответить | Правка | Наверх | Cообщить модератору

143. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от анон (?), 25-Мрт-26, 12:44

прочитай пост повторно и попробуй осмыслить, что имел ввиду комментатор выше. очень полезное упражнение

Ответить | Правка | Наверх | Cообщить модератору

123. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." –1 +/–

Сообщение от Джон Титор (ok), 18-Мрт-26, 10:39

А если поставить Aider, то больше команда разработчиков не нужна

Ответить | Правка | Наверх | Cообщить модератору

138. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Аноним (139), 21-Мрт-26, 09:49

Что, плохо продаются вайб-курсы/модельки?

Ответить | Правка | Наверх | Cообщить модератору

140. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 22-Мрт-26, 00:20

А что вас заинтересовало?

Ответить | Правка | Наверх | Cообщить модератору

141. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Любитель курсов (?), 23-Мрт-26, 15:30

А почему вы спрашиваете?

Ответить | Правка | Наверх | Cообщить модератору

145. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..." +/–

Сообщение от Джон Титор (ok), 30-Мрт-26, 21:18

> А почему вы спрашиваете?
А что вы предлагаете? OpenDevin, GPT PILOT, Plandex?
Разве Aider не проще допилить и использовать?
Вот я бы не очень хотел бы втыкать монитор и проверять каждый шаг ИИ. Только каждые несколько часов и принимать только то что годное.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру

1. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
Сообщение от Аноним (1), 17-Мрт-26, 11:31
Кто пользуется подобным, какое железо нужно, чтобы запустить? Сам использую qwen code, было бы интересно запускать всё локально
Ответить \| Правка \| Наверх \| Cообщить модератору


	4. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (4), 17-Мрт-26, 11:38
	>Leanstral-2603 121 GB https://huggingface.co/mistralai/Leanstral-2603/tree/main Дорогое.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	6. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–8 +/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 11:41
	Замечу что из описания следует что русский язык оно не поддерживает
	Ответить \| Правка \| Наверх \| Cообщить модератору


	42. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+14 +/–
	Сообщение от Аноним (4), 17-Мрт-26, 13:09
	На кириллице кодите ? Что не комментарий от вас, то откровение.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	45. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+3 +/–
	Сообщение от aname (ok), 17-Мрт-26, 13:19
	1C
	Ответить \| Правка \| Наверх \| Cообщить модератору


	67. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+4 +/–
	Сообщение от Аноним (4), 17-Мрт-26, 16:09
	вайб-кодинг 1С ? К такому я ещё не готов.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	101. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+6 +/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 20:37
	Зря
	Ответить \| Правка \| Наверх \| Cообщить модератору


	59. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+1 +/–
	Сообщение от Аноним (59), 17-Мрт-26, 15:22
	Дык он из будущего. Он знает.
	Ответить \| Правка \| К родителю #42 \| Наверх \| Cообщить модератору


	98. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 20:34
	В статье ссылка: https://huggingface.co/mistralai/Leanstral-2603 Там в файле Readme все написано. Вы ведь английский знаете? p.s. я тоже знаю, но терпеть не могу.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	99. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 20:36
	На всякий случай выпишу, а то не найдете: Leanstral offers these capabilities: Multilingual: Supports English, French, Spanish, German, Italian, Portuguese, Dutch, Chinese, Japanese, Korean, and Arabic
	Ответить \| Правка \| К родителю #59 \| Наверх \| Cообщить модератору


	144. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Джон Титор (ok), 26-Мрт-26, 16:34
	> На кириллице кодите ? Что не комментарий от вас, то откровение. На CESIL. Тут целая история: https://blog.scribblings.com/progaming-languages-1-cesil
	Ответить \| Правка \| К родителю #42 \| Наверх \| Cообщить модератору


	73. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–1 +/–
	Сообщение от Аноним (73), 17-Мрт-26, 16:27
	Поддерживает.
	Ответить \| Правка \| К родителю #6 \| Наверх \| Cообщить модератору


	119. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+1 +/–
	Сообщение от Джон Титор (ok), 18-Мрт-26, 09:37
	> Поддерживает. Может вы спросите у этого ИИ? https://chat.mistral.ai/chat > Какая ты модель? Какие языки поддерживаешь? >> Я — Le Chat, помощник на основе искусственного интеллекта, созданный Mistral AI. Поддерживаю множество языков, включая украинский, русский, английский, французский, испанский, немецкий и многие другие. > На сайте в документации: https://huggingface.co/mistralai/Leanstral-2603 указано что ты поддерживаешь много языков, но русского там нет >> Давай разберёмся: модель Leanstral-2603 — это специализированный кодовый агент от Mistral AI, предназначенный для работы с Lean 4 (языком доказательств и формальной верификации). Она оптимизирована для формальных доказательств, работы с математическими объектами и спецификациями программного кода, а не для общения на естественных языках. Поэтому в её документации не упоминаются языки вроде русского, английского или украинского — она просто не предназначена для этого >> Я же, как Le Chat, — это универсальная языковая модель, которая поддерживает множество естественных языков, включая русский, украинский, английский и другие. Если у тебя есть вопросы по программированию, математике или просто общение — спрашивай! > То Leanstral-2603 не поддерживает русский или поддерживает? >> Модель Leanstral-2603 — это специализированный кодовый агент для работы с Lean 4, она не предназначена для общения на естественных языках, включая русский. Её основная задача — помощь в формальных доказательствах и работе с математическими объектами, а не поддержка разговорных языков
	Ответить \| Правка \| Наверх \| Cообщить модератору


	56. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от подчиняйся свободе GPL (?), 17-Мрт-26, 14:45
	Естественно. Придется Core 2 Duo апгрейдить. А это дорого. На макарошки не хватит
	Ответить \| Правка \| К родителю #4 \| Наверх \| Cообщить модератору


	5. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–4 +/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 11:39
	Тут главное видеокарта и её объем памяти. Лучше брать все что выше 16Гб и NVidia. Можно конечно и под других производителей адаптировать, а некоторые сразу поддерживают, но чаще всего для этого придется потанцевать с бубном. Можно все немного ускорить заморозив код и скомпилировать пайтон, но правки придется делать. Процессор хороший тоже не помешал бы, бывает что-то слетает и если протанцевали с бубном под не ту видеокарту под которую оно сделано, то можно настроить переход на процессор, но это в 10 раз дольше выполнение.
	Ответить \| Правка \| К родителю #1 \| Наверх \| Cообщить модератору


	87. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (87), 17-Мрт-26, 19:31
	>Лучше брать все что выше 16Гб и NVidia. А дешевле - ровно 16 гигабайт или ниже и не nvidia.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	104. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 20:40
	А дешевле можно, но даже ради учебы - пустая трата времени. Генерировать будет, но медленно. И текст, и картинки. Можно вообще на CPU или оптимизированные модели. Но лучше это время потратить с умом или воспользоваться сервисами.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	12. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (4), 17-Мрт-26, 11:59
	Чтоб хоть как-то запустилось 128 Гб DDR5 ОЗУ. Или можно одну NVIDIA H200.
	Ответить \| Правка \| К родителю #1 \| Наверх \| Cообщить модератору


	34. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (34), 17-Мрт-26, 12:56
	> Чтоб хоть как-то запустилось И выдало хоть какие-то результаты.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	106. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–1 +/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 20:41
	А оно хоть Doom запустит?
	Ответить \| Правка \| К родителю #12 \| Наверх \| Cообщить модератору


	13. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–4 +/–
	Сообщение от Аноним (13), 17-Мрт-26, 12:02
	Нужно было интересоваться до взлета цен на память. Купить максимум во все слоты по 32гб = 128гб. Да любая видяха пойдет. Я на интегрированной 8700G. Но модели 30-60гб юзаю (q6). Квен3-кодер-30b полюбился. Главная проблема - научиться общаться с ии. Придется слова учиться подбирать и вычищать промпт от "помогающих" инструкций. Модели от devstral ужасны. Европа загнила. Фантасмагорический язык они придумали, а компилятор или интерпретатор существует? Короче он нам и нафиг не нужон Ленстрал ваш. Вайбкодинг не существует, это протокол.
	Ответить \| Правка \| К родителю #1 \| Наверх \| Cообщить модератору


	29. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	–1 +/–
	Сообщение от Аноним (29), 17-Мрт-26, 12:50
	Вообще-то максимум для DDR5 4x48 Gb, но нужна поддержка процом и мамой.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	57. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+2 +/–
	Сообщение от Аноним (4), 17-Мрт-26, 14:51
	То замёрзла, то загнила, то ли дело у нас!
	Ответить \| Правка \| К родителю #13 \| Наверх \| Cообщить модератору


	126. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Джон (?), 18-Мрт-26, 12:34
	GPT OSS даже 20b дает во все щели убогому квен, а так квен самые слабые модели.
	Ответить \| Правка \| К родителю #13 \| Наверх \| Cообщить модератору


	14. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+2 +/–
	Сообщение от Андрей (??), 17-Мрт-26, 12:02
	Вообще чем мощнее тем лучше, дальше по убыванию скорости генерации: 1) "вся модель должна влезть в VRAM" -> 2) "Часть модели влазит в VRAM, остальная часть помещается в RAM" -> 3) "Часть модели в VRAM, часть в RAM, часть в SSD swap(В случае MoE моделей на ура) 4) "Вся модель в RAM" 5) "Часть в RAM, часть в SWAP" Короче дальше думаю ясно, по итогу ключевое наверное ограничение, это чтобы на базу и плотные слои(или активируемую часть экспертов) хватало по минимуму VRAM + RAM, тогда потыкать в разумных пределах можно любую модель, в противном случае - суета. На удивление для себя обнаружил(хотя и ожидал), что в ноут 8VRAM + 32RAM вполне влезла 80B MoE q6 модель, да ещё и работает на ~4 т/с, что вполне годно и по качеству и по скорости для автономной LLM, если бы ещё заморочится и переупорядочить экспертов(в пользу самых востребованных) и поколдовать с матричками активации, то так вообще космос будет.
	Ответить \| Правка \| К родителю #1 \| Наверх \| Cообщить модератору


	83. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+1 +/–
	Сообщение от Аноним (4), 17-Мрт-26, 17:40
	А дальше уже всё будет ограниченно самим чипом, контроллером памяти и даже самой моделью: https://signal65.com/wp-content/uploads/2025/03/chart01.webp
	Ответить \| Правка \| Наверх \| Cообщить модератору


	17. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+3 +/–
	Сообщение от Джон Титор (ok), 17-Мрт-26, 12:06
	В моделях как правило есть ещё B параметры (B = биллионы, миллиарды). Параметры — это веса нейронной сети: числа, которые хранятся в памяти и участвуют в вычислениях при каждом токене. Грубо: чем их больше, тем больше "знаний" и контекста модель может удерживать. 1B параметров ≈ 2 ГБ в памяти при float16, или ≈ 0.5 ГБ при 4-битной квантизации. Важный нюанс про MoE (Mixture of Experts) — это как раз случай Leanstral/Devstral 2 в статье. Модель имеет 119B "всего" параметров, но активирует только 6.5B на каждый токен. Остальные "эксперты" в этот момент спят. Это значит, что вычислений меньше (скорость выше), но в памяти нужно держать всё равно почти все 119B — потому что неизвестно заранее, какой эксперт понадобится. Железо: минимум и комфорт Вот реальная картина по трём размерам моделей из этой истории: Модель Devstral Small 2 24B dense, Apache 2.0 контекст 256K Минимум RTX 3090 / 24 ГБ VRAM, Q4 квантизация, Mac 32 ГБ RAM, ~20 tok/s, контекст 32–57K Хорошо работает RTX 4090 / 24 ГБ, RTX 3090 / 24 ГБ, AMD 6700 XT ×2 / 24 ГБ, ~44 tok/s (RTX 3090, Q4) Комфортно RTX A6000 / 48 ГБ, Mac M3 Max / 96 ГБ, ~55 tok/s, полный контекст 256K Devstral 2 (MoE), 123B / 6.5B активных, контекст 256K Минимум 72+ ГБ VRAM, RTX 3090 ×4 или 4090 ×3, Q2 квантизация, Медленно, контекст 4–16K Хорошо работает 96 ГБ unified RAM, Ryzen AI Max+ 395 96ГБ (~$1500), Mac M3/M4 Max 96 ГБ, Умеренно, контекст ~64K Комфортно 128 ГБ unified RAM, RTX Pro 6000 Blackwell, Dual RTX 4090 48ГБ, Нормальная скорость, полный контекст Вывод по железу: Для Leanstral (119B MoE) локально — это уровень энтузиастов с бюджетом от $1500 только на железо: либо Ryzen AI Max+ 395 с 96 ГБ unified memory, либо Apple Silicon M3/M4 Max с 96–128 ГБ, либо несколько потребительских GPU в связке. На обычном домашнем ПК с одной видеокартой — не запустить. Devstral Small 2 (24B) — другая история: одна RTX 3090/4090 справляется реально и выдаёт приемлемую скорость. Если сравнивать с Qwen2.5-Coder, который ты уже используешь — они в одной весовой категории, разница только в специализации (Devstral заточен под агентные задачи и тулколлинг). Про модели в статье Статья слегка путает названия: Leanstral и Devstral — это разные вещи. Leanstral — это специализированная модель именно под Lean 4 и формальную верификацию. Devstral — это общий coding-агент от Mistral. Судя по описанию (119B параметров, 6.5B активируемых) — речь о MoE-архитектуре, это скорее относится к Devstral 2 (123B). Я ещё попросил составить по другим моделям ИИ чтоб он посчитал от дешевым к дорогим, минутку.
	Ответить \| Правка \| К родителю #1 \| Наверх \| Cообщить модератору


	54. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от booksy (?), 17-Мрт-26, 14:34
	Всё чётко разложил. Что посоветуете на бюджет до 4500-5000 евро? Интересно именно кодинг и эта новая модель выглядит многообещающей.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	71. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (4), 17-Мрт-26, 16:22
	https://www.google.com/search?q=&hl=ru&aep=22&udm=50
	Ответить \| Правка \| Наверх \| Cообщить модератору


	82. "Mistral опубликовал Leanstral, AI-модель для вайб-кодинга с ..."	+/–
	Сообщение от Аноним (82), 17-Мрт-26, 17:36
	> Что посоветуете на бюджет до 4500-5000 евро? Openrouter. И найти работу.
	Ответить \| Правка \| К родителю #54 \| Наверх \| Cообщить модератору