The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Атака Trojan Source для внедрения изменений в код, незаметных для разработчика"
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Подсказка: Ссылки "<<" и ">>" открывают первые и последние 10 сообщений.
. "Атака Trojan Source для внедрения изменений в код, незаметны..." +/
Сообщение от keydon (ok), 09-Ноя-21, 18:45 
> Подход - одинаковый. И правильный.
> Перечитайте то, что я написал выше. Погуглите "кириллица" и "история появления кириллицы".

Если по происхождению формировать блоки, то по вашей логике кириллица должна использовать глаголицу и например ь в русском должен быть U2C13 а не U042C. Но в юникоде это не так. Т.е. как сделано в юникоде все равно не логично, а если бы и было сделано по такой логике то это все равно был бы кусок !@#$%%^, т.к. логика сводить к историческим причинам крайне не надежно - что там было в древности никто не знает, исторические представления неоднократно переписывались и что делать если на язык воздействовало сразу два языка с одинаковым символом и какой из них оказал большее влияние - не понятно.

> Оно так и есть. Кирилличная "А" вне зависимости от языка кодируется как кирилличная "А". И даже если какая-нибудь донская область внезапно объявит себя Донской Республикой со своим, Донским Языком (вернет в язык букву ѣ), всем программистам мира не придется переделывать таблицу юникода.

Сами юникодовцы придумали проблему - кодировать символы, а не глифы, сами же от нее отказались делая такое "наследование" между схожими алфавитами, сами же придумали планы и разделение внутри планов, самим же пришлось тусовать планы как придется без всякой логики.
Просто кодируйте глифы и не надо никаких заморочек с алфавитами, историей и т.д..

>Какого именно русского языка - до реформы 1918 или после? Вы предлагаете менять таблицу кодов под каждое изменение национальных правил, заставляя переписывать все парсеры?
> Языки, напомню, развиваются. В них появляются и исчезают даже буквы (украинцы вернули букву ґ, например - совершенно непонятно зачем, но закон есть закон). Теперь что, всю украинскую кодировку после "г" сдвигать и все переписывать? А как насчет русской "ё", которая то есть, то нет (гляньте на википедии, там статья почти как война и мир по размеру)?

Я то как раз против разделения по семантике (за глифы и там таких проблем нет принципиально и бнз маппинга принципиально не обойтись). А юникодовцы сами себе проблемы придумали разбивать по блокам и теперь тасуют и блоки как придется и вроде как и не глифы но вроде как и не совсем семантика.

> Это будет почти так же быстро, как и проверка x <= y <= z,

Почти также быстро это логарифмическая сложность против константной? Вы это серьезно?

> Слив засчитан. Будем считать, что вы поняли ошибку но решили ее просто замять, ибо слишком позорно.

Ошибка весьма условная и в кругу дотошных филологов можно долго выяснять что значит кодировка на русском, charset на английском и что они значили до юникода. Все всё поняли, но снобы все равно посмеялись чтобы потешить ЧСВ. Вы же называете логарифмическую сложность почти такой же быстрой как и константную и это уже не смешно.

>Это особенности естественных языков. Юникод им только следует, не более того.
> Да, греческую "ᾙ" действительно можно приводить либо к "ᾑ" либо к "ἡι" - это особенности правописания. И эти особенности отражены в юникоде.

Это особенность семантического разделения. Или недосемантического как в юникоде.

> Стандарт прост как два байта.

Ну да, ну да. Видимо в этой https://www.oreilly.com/library/view/unicode-explained/05961.../ книге первые 10 страниц рассказывается как все просто, а оставшиеся 670 страниц пустые. И в других книгах https://www.unicode.org/announcements/books.html то же самое. И документация только core specification на 1000+ страниц просто была рассчитана на альтернативное использование в виде топки, а не распухла из-за излишней сложности. А бесконечное статьи от опытных разработчиков про проблемы с юникодом это затянувшиеся на несколько лет первоапрельские розыгрыши.

> Что может быть проще таблицы всех человеческих букв/рун/символов письма?

О нет, это до юникода кодировки в основном были таблицами (которые юникод должен был устранить и как раз он первый из популярных перестал отображать конкретный символ в конкретную последовательность бит), а юникод это еще и гигантское количество правил для отображения и в них вся загвоздка.

>Вы на английском читать не умеете? Ну тогда понятно откуда такое желание все взять и переделать.
>Цитирую:
>The Unicode Basic Multilingual Plane covers 216 (65,536) code points. Of this number, 2,048 are reserved for special use as UTF-16 surrogate pairs and 6,400 are reserved for private use. This leaves 57,088 code points to which glyphs can be assigned. Some of these code points are special values that do not have an assigned glyph, but most do have assigned glyphs.
>GNU Unifont покрывает ВСЕ ваши потребности в юникоде, причем с запасом. 60691 глифов против 57088 предлагаемых.

Тогда почитайте получше потому что в цитате вы упустили _Basic_Plane, что значит что шрифт покрывает только базовый план и еще на сайте http://unifoundry.com/unifont/index.html они указывают что поддерживают 12613 глифов plan1, а всего их планов 16 и пускай большая часть не заполнена, но как миниум plan2 в unifont'е нет, а значит и всей поддержки юникода тоже нет.

>Перечитайте то, что я написал выше. Погуглите "кириллица" и "история появления кириллицы". Думайте.
>Слив засчитан. Будем считать, что вы поняли ошибку но решили ее просто замять, ибо слишком позорно.
>Так что, теперь еще человеческие языки переделывать, вот прям с Плутарха начиная? Для вашего удобства?
>Ого как замахнулись.
> Вы на английском читать не умеете? Ну тогда понятно откуда такое желание все взять и переделать.
> На этом, надеюсь, все? Можете сделать выводы из написанного и немножечко дообразоваться? Или будете просто глупо упираться в свои заблеждения, как всегда делают 95% народонаселения.

По делу сказано не много и много неправильного, но спеси как от всех гениев человечества вместе взятых.

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Атака Trojan Source для внедрения изменений в код, незаметных для разработчика, opennews, 01-Ноя-21, 22:01  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру