The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск утилиты GNU grep 3.4, opennews (?), 03-Янв-20, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


16. "Выпуск утилиты GNU grep 3.4"  –1 +/
Сообщение от Wilem (?), 03-Янв-20, 14:25 
Объясни по-подробнее про особенности utf8, что не так?
Ответить | Правка | Наверх | Cообщить модератору

21. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Аноним (21), 03-Янв-20, 14:51 
Я не знаю, что он имел в виду, но венда тоже не умеет в utf8. По-моему я даже в бсод ронял 10 и кучу програм в ней всего 1 символом (совершенно валидным в линуксе), не знаю, починили ли с тех пор. Так что особенности есть.
Ответить | Правка | Наверх | Cообщить модератору

23. "Выпуск утилиты GNU grep 3.4"  –1 +/
Сообщение от Wilem (?), 03-Янв-20, 15:02 
https://snipboard.io/5E9mRX.jpg
Ответить | Правка | Наверх | Cообщить модератору

25. "Выпуск утилиты GNU grep 3.4"  –1 +/
Сообщение от Аноним (21), 03-Янв-20, 15:28 
> https://snipboard.io/5E9mRX.jpg

Там свой особенный утф8, мало общего имеющий со стандартом. Дело не в том, что он не отображается, а в том, что юникод в венде будет совершенно свой (и если использовать его, проблемы будут у других систем), а часть символов и вовсе вызовет бсод и инстакраши софта (передаю привет notepad++). В линуксах не крашится.

Ответить | Правка | Наверх | Cообщить модератору

28. "Выпуск утилиты GNU grep 3.4"  –1 +/
Сообщение от Wilem (?), 03-Янв-20, 15:45 
А что за символы с которыми крешится или которые несовместимы? Прям сейчас бы опробовал на винде и линуксе.
Ответить | Правка | Наверх | Cообщить модератору

30. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Аноним (21), 03-Янв-20, 16:00 
> А что за символы с которыми крешится или которые несовместимы? Прям сейчас
> бы опробовал на винде и линуксе.

Я не помню, какие именно, но даже в википедии емнип было написано (в японской [1] так точно). Ну вот к примеру описываемые мной различия у вендоров [2].


[1] https://ja.wikipedia.org/wiki/Unicode
[2] https://web.archive.org/web/20110422181018/http://www.ingrid...

Ответить | Правка | Наверх | Cообщить модератору

67. "Выпуск утилиты GNU grep 3.4"  –3 +/
Сообщение от Аноним (67), 03-Янв-20, 22:33 
UTF-8 не нужен при наличии полноценного юникода. Квест "угадай сколько байтов потянет каждый символ длинной-предлинной строчки если в ней гарантированно не только латиница" сильно на любителя.
Ответить | Правка | К родителю #21 | Наверх | Cообщить модератору

69. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Аноним (21), 03-Янв-20, 22:57 
> UTF-8 не нужен при наличии полноценного юникода. Квест "угадай сколько байтов потянет
> каждый символ длинной-предлинной строчки если в ней гарантированно не только латиница"
> сильно на любителя.

Полноценный - это какой? UTF-32? Ну да, там есть небольшой запас, чтобы на это забить и считать 4 байта примерно равно 1 символ (и то с оговорками вроде модифицирующих кодпоинтов). Только ведь он жутко неэффективный в части занимаемой памяти, правда?

Ответить | Правка | Наверх | Cообщить модератору

70. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Michael Shigorinemail (ok), 03-Янв-20, 23:09 
> Полноценный - это какой? UTF-32?

В винде вроде двухбайтовый UCS2 фигурировал...

PS: "полноценный", ага.

Ответить | Правка | Наверх | Cообщить модератору

83. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Аноним (83), 04-Янв-20, 23:08 
В UTF-8 в теории символ может до 6 байт весить, это сильно лучше или как?
Ответить | Правка | К родителю #69 | Наверх | Cообщить модератору

84. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Аноним (21), 04-Янв-20, 23:23 
> В UTF-8 в теории символ может до 6 байт весить, это сильно
> лучше или как?

Очень в теории, текущий лимит 4 байта из соображений совместимости. И всяко лучше utf-16. [1] %)

По-моему, на практике 4 довольно редко встречалось и только в китайских текстах. Но это совершенно не важно, случайный доступ с юникодом просто не применяют.

[1] https://en.wikipedia.org/wiki/Plane_(Unicode)

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру