The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..., opennews (?), 09-Май-14, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


7. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +/
Сообщение от Гость (?), 10-Май-14, 00:29 
> Всё надуманно

Оскара за комментарий.

> оторвано от реальности

Так автор как раз и предлагает сделать ближе к реальности - принудить людей отвечать за свои слова в Интернете.

Про оторванность KOI8 попродробней, пожалуйста. Особенно в части вала неоторванных от реальности альтернатив на момент появления KOI8-R.

Ответить | Правка | Наверх | Cообщить модератору

9. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  –1 +/
Сообщение от хм (?), 10-Май-14, 00:40 

> Про оторванность KOI8 попродробней, пожалуйста. Особенно в части вала неоторванных от реальности
> альтернатив на момент появления KOI8-R.

альтернатив не было. От этого КОИ8 перестает быть надуманным?

Ответить | Правка | Наверх | Cообщить модератору

29. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +/
Сообщение от Мимо прохожу (?), 10-Май-14, 08:10 
школота, на Андрюху батон не крошите - супер пацан, пересекался с ним еще в девяностые...
uucp - наше все ;)
Ответить | Правка | Наверх | Cообщить модератору

32. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +/
Сообщение от хм (?), 10-Май-14, 08:28 
не хнычь. Пацан решил сам захотел батонами мериться.
Ответить | Правка | Наверх | Cообщить модератору

128. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +/
Сообщение от Demo (??), 11-Май-14, 14:25 
> школота, на Андрюху батон не крошите - супер пацан, пересекался с ним

Ваше определение ache как "пацан" звучит крайне неинтеллигентно.

Ответить | Правка | К родителю #29 | Наверх | Cообщить модератору

211. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +/
Сообщение от fi (ok), 05-Июн-14, 13:41 
только не uucp, a uupc - вот ваше все :))))
Ответить | Правка | К родителю #29 | Наверх | Cообщить модератору

42. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –7 +/
Сообщение от arisu (ok), 10-Май-14, 12:08 
> альтернатив не было. От этого КОИ8 перестает быть надуманным?

кодировка как кодировка. однозначно лучше UTF.

Ответить | Правка | К родителю #9 | Наверх | Cообщить модератору

43. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +6 +/
Сообщение от usira (?), 10-Май-14, 12:09 
>> альтернатив не было. От этого КОИ8 перестает быть надуманным?
> кодировка как кодировка. однозначно лучше UTF.

чем грузины!

Ответить | Правка | Наверх | Cообщить модератору

45. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от arisu (ok), 10-Май-14, 12:11 
срезал!
Ответить | Правка | Наверх | Cообщить модератору

48. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +2 +/
Сообщение от Аноним (-), 10-Май-14, 13:25 
> кодировка как кодировка. однозначно лучше UTF.

У вас в слове "хуже" целых три опечатки, уважаемый.

Ответить | Правка | К родителю #42 | Наверх | Cообщить модератору

49. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 10-Май-14, 13:57 
>> кодировка как кодировка. однозначно лучше UTF.
> У вас в слове "хуже" целых три опечатки, уважаемый.

кодировка, где длина представления символа в байтах зависит от положения символа в таблице — говно.

Ответить | Правка | Наверх | Cообщить модератору

53. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 10-Май-14, 14:53 
Сначала научи KOI8 понимать что-то кроме кириллици и латиницы, а потом уже на переменную длину символа бочку кати.
Ответить | Правка | Наверх | Cообщить модератору

58. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –4 +/
Сообщение от arisu (ok), 10-Май-14, 15:18 
> Сначала научи KOI8 понимать что-то кроме кириллици и латиницы

а мне больше ничего не надо.

Ответить | Правка | Наверх | Cообщить модератору

60. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +3 +/
Сообщение от Аноним (-), 10-Май-14, 15:25 
> а мне больше ничего не надо.

А меня вот крокозябли в программах - анноят. KOI8, как и остальные однобайтовые - не несут в себе сведений о том какой это, собственно, code page/кодировка. И это - их фатальный недостаток. Чтобы корректно отобразить содержимое в однобайтовой кодировке - приходится делать могучий статистический анализ текста. Выбирая между такими наворотами в моих программах и многобайтовыми символами - ну ты понял...

Ответить | Правка | Наверх | Cообщить модератору

87. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –3 +/
Сообщение от Аноним (-), 10-Май-14, 19:11 
Я нет. Ты роешься по свалкам собирая нов^W незвестные тексты? Нет? А почему тогда ты не знаешь в какой они кодировке?
Ответить | Правка | Наверх | Cообщить модератору

92. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +2 +/
Сообщение от Аноним (-), 10-Май-14, 19:42 
> Я нет.

Кидос пошел в отрицание? Стандартно.

> Ты роешься по свалкам собирая нов^W незвестные тексты? Нет?

Еще не хватало, чтобы я строился под компьютеры/ос и чтобы они мне диктовали где рыться, куда пойти и что делать.

> А почему тогда ты не знаешь в какой они кодировке?

Потому что машинная работа - для машин. А мне неудобно тратить мое время на ручное тыкание кодировки в случае если я не угадал. Прикинь?

Заметь, ты глупое киддо и не можешь обосновать свою точку зрения. А я могу. Этим мы и отличаемся.

Ответить | Правка | Наверх | Cообщить модератору

182. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от рео (?), 12-Май-14, 11:21 
Тексты на разных языках.
Бывают регионы, где общаться на 3+ языках -- обычное дело.
Ответить | Правка | К родителю #87 | Наверх | Cообщить модератору

193. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от arisu (ok), 12-Май-14, 19:16 
> Тексты на разных языках.
> Бывают регионы, где общаться на 3+ языках -- обычное дело.

pust' perehodiat na latinskiy alfavit.

Ответить | Правка | Наверх | Cообщить модератору

197. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Watman (?), 13-Май-14, 09:31 
Tak i delau ;-)
Ответить | Правка | Наверх | Cообщить модератору

198. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Andrey Mitrofanov (?), 13-Май-14, 09:34 
>> Бывают регионы, где общаться на 3+ языках -- обычное дело.
> pust' perehodiat na latinskiy alfavit.

И эсперанто!

Ответить | Правка | Наверх | Cообщить модератору

205. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от anonymous (??), 13-Май-14, 15:46 
И животноводство!
Ответить | Правка | К родителю #198 | Наверх | Cообщить модератору

125. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –4 +/
Сообщение от Тот_Самый_Анонимус (?), 11-Май-14, 14:11 
В кои-то веки соглашусь.
Ответить | Правка | К родителю #49 | Наверх | Cообщить модератору

208. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от burjui (ok), 14-Май-14, 14:15 
Ну, раз для тебя UTF-8 - говно, пользуйся UTF-32
Ответить | Правка | К родителю #49 | Наверх | Cообщить модератору

209. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 14-Май-14, 18:51 
> Ну, раз для тебя UTF-8 - говно, пользуйся UTF-32

я уж лучше UCS-4.

Ответить | Правка | Наверх | Cообщить модератору

55. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 10-Май-14, 15:07 
> кодировка как кодировка. однозначно лучше UTF.

В UTF8 есть информация о том к какому языку принадлежит символ, а в KOI-8 оно где-то сбоку. За одно это однобайнтые кодировки должны сдохнуть жестокой смертью, при всей симпатии к символам фиксированного размера. Потому что читать крокозябли за столько лет уже несколько достало.

Ответить | Правка | К родителю #42 | Наверх | Cообщить модератору

65. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 10-Май-14, 15:42 
> За одно это однобайнтые кодировки должны сдохнуть жестокой смертью

а я не говорил, что должны быть именно однобайтовые. в кодировке размер в байтах представления символа должен быть одинаковый для всех символов, не более.

Ответить | Правка | Наверх | Cообщить модератору

69. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 10-Май-14, 15:49 
> должен быть одинаковый для всех символов, не более.

А он у кого-то что-то занимал, что "должен"? Это лишь твое частное мнение, не более. Ну то-есть я согласен что переменный размер символов не совсем удобно, но с другой стороны это позволяет кодировать даже экзотичные и навернутые символы без многократного оверхеда для простых. И если выбирать между статистическим анализом "а что это вообще такое?" и символами переменного размера - я уж лучше символами переменного размера буду пользоваться. А тратить по 4 байта на каждую английскую букву меня таки жаба давит.

Ответить | Правка | Наверх | Cообщить модератору

72. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от arisu (ok), 10-Май-14, 16:03 
>> должен быть одинаковый для всех символов, не более.
> А он у кого-то что-то занимал, что "должен"?

у здравого смысла.

> А тратить по 4 байта на каждую английскую букву меня таки
> жаба давит.

да, 2 кб памяти, беда.

Ответить | Правка | Наверх | Cообщить модератору

78. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 10-Май-14, 17:55 
> у здравого смысла.

Как по мне так с точки зрения здравого смысла UTF8 является разумным компромиссом между универсальностью и эффективностью: наиболее часто используемые символы компактны, но если надо - можно передать и весьма хитрозагнутые вещи.

> да, 2 кб памяти, беда.

Во первых, системы бывают разные. Во вторых, 2 килобайта 1-байтного текста превратятся в минимум 8 если использовать 32-битный уникод. А скажем 16-битный позволяет всего 65К символов, что как-то мало для ВСЕХ языков и ВСЕХ символов которые встречаются. Вот видимо и пришли к UTF8 как некоему компромиссу.

Хотя лично мне нравится схема компрессирования уникода используемая на сим-картах: передается кодовая страница и потом - 1-байтовые данные. При необходимости кодовую страницу можно перебросить и отгрузить данные из другого куска уникода. Но такая схема не слишком устойчива к повреждениям данных: если выпадет переключение кодовой страницы, поток сорвется и будет нечитаем вплоть до следующего переключения страницы (которое в простейших случаях может не быть никогда, на сим-картах как правило только 1 раз в начале, что позволяет хранить на карте запись в национальной кодировке с минимальной потерей в размере записи).

Ответить | Правка | Наверх | Cообщить модератору

83. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 10-Май-14, 18:33 
utf-8 — хорошая кодировка для *обмена* *данными*. фигня в том, что её пытаются применять и как *внутреннюю* кодировку, что уже фэйл.
Ответить | Правка | Наверх | Cообщить модератору

93. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +2 +/
Сообщение от Аноним (-), 10-Май-14, 19:46 
> utf-8 — хорошая кодировка для *обмена* *данными*. фигня в том, что её
> пытаются применять и как *внутреннюю* кодировку, что уже фэйл.

А как внутренняя она хороша тем что
1) не надо конвертить то что пришло через I/O.
2) большинство существующих программ нормально относится к utf-8 без явной переделки.

С уникодом типа UTF-16 такой номер не пройдет, софт придется кардинально перепахивать. Чего всем лениво, разумеется.

Ответить | Правка | Наверх | Cообщить модератору

116. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 11-Май-14, 11:55 
> А как внутренняя она хороша тем что
> 1) не надо конвертить то что пришло через I/O.
> 2) большинство существующих программ нормально относится к utf-8 без явной переделки.

особенно удобно со строками работать. удовольствие просто.

Ответить | Правка | Наверх | Cообщить модератору

129. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +2 +/
Сообщение от Аноним (-), 11-Май-14, 14:56 
> особенно удобно со строками работать. удовольствие просто.

Единственные крупные грабли которые я так сразу вижу - сложно взять "хренадцатый по счету символ от начала строки". В смысле, без разбора всей последовательности. Но это нишевая и редкая задача. А остальное - хм? Объединение строк по идее не отличается вообще. Вещи типа разбивания на слова что так что сяк требует парсить все что на вход пришло. Как и поиск. И вообще, UTF8 оформлен как эдакая надстройка над ASCII, так что его как правило без проблем понимают все кто не давился 8-битными символами. Большинству программ можно вообще ничего не знать про UTF8 - просто гонять последовательности 8-битных байтов и всё. А как их отображать - вообще проблема у другого парсера, который зачастую не часть программы даже.

Ответить | Правка | Наверх | Cообщить модератору

105. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Bxemail (ok), 10-Май-14, 22:57 
> Хотя лично мне нравится схема компрессирования уникода используемая на сим-картах: передается
> кодовая страница и потом - 1-байтовые данные. При необходимости кодовую страницу
> можно перебросить и отгрузить данные из другого куска уникода. Но такая
> схема не слишком устойчива к повреждениям данных: если выпадет переключение кодовой
> страницы, поток сорвется и будет нечитаем вплоть до следующего переключения страницы
> (которое в простейших случаях может не быть никогда, на сим-картах как
> правило только 1 раз в начале, что позволяет хранить на карте
> запись в национальной кодировке с минимальной потерей в размере записи).

Вы уверены, что SIM-карта хранит данные именно так? Используется перекодировка, Вы считаете? Отличные от содержащихся в GSM-кодировке символы обычно передаются в UCS2, что заставляет SIM хранить что-то в отличном формате???

Внимание, вопрос! Как происходит переключение кодовых страниц?

Ответить | Правка | К родителю #78 | Наверх | Cообщить модератору

130. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 15:07 
> Вы уверены, что SIM-карта хранит данные именно так?

Я читал соотв. доки с etsi.org, так что уверен. Там есть несколько вариантов сохранения записей. Один из них (реально используемый рядом мобильников) - достаточно хитро и разумно компрессованый уникод, позволяющий терять лишь несколько символов относительно однобайтового представления, а не половину, как более лобовая передача уникода (в SMS с этим хуже, например).

> Используется перекодировка, Вы считаете?

Нечто типа компрессии: кодовая страница посылается в начале последовательности, ну и когда надо перейти на иную кодовую страницу (скажем закончили писать на немецком языке и желаем теперь японский). Остальные данные являются смещением в рамках code page и лезут в 1 байт. Такой хитрый маневр позволяет терять

> заставляет SIM хранить что-то в отличном формате???

Нежелание продалбывать половину размера записи.

> Внимание, вопрос! Как происходит переключение кодовых страниц?

Элементарно, ватсон: выделена некая уникальная последовательность, которая указывает в какой кодовой странице будут дальнейшие данные. В простейшем случае она лишь в начале записи (на нее и теряется несколько байтов), остальное - однобайтовые данные указывающие смещение относительно начала базы code page, лезет в 1 байт. Получается нечто типа дельта-компрессии уникода, пользующееся тем фактом что с немецкого на японский переключаются не так уж часто, поэтому полное смещение передавать чаще всего - довольно расточительно.

При таком раскладе русское имя на сим-карте обрубается не в половину записи, а лишь на ~3 символа относительно чисто-английского представления, а не на половину, как могло бы быть.

Ответить | Правка | Наверх | Cообщить модератору

203. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от Seykoemail (?), 13-Май-14, 13:10 
>> Внимание, вопрос! Как происходит переключение кодовых страниц?
> Элементарно, ватсон: выделена некая уникальная последовательность, которая указывает
> в какой кодовой странице будут дальнейшие данные. В простейшем случае она
> лишь в начале записи (на нее и теряется несколько байтов), остальное
> - однобайтовые данные указывающие смещение относительно начала базы code page, лезет
> в 1 байт.

Согласен с вопрошающим: как конкретно выглядит эта уникальная последовательность?
Давно хочу использовать именно такую кодировку. Но писать в начале файла
CodePage=866 -- не выход. Дугое дело -- когда что-то где-то стандартизировано.

Относительно текстов -- можно передавть кодировку в начале каждой строки или
не передавать (для ANSI). Предположительно это должна быть ESC-последовательность.
Тогда программам не придётся заморачиваться с кодировкой, это будет проблемой
tty-драйвера. Кое-какие ESC-последовательности уже есть. Например переход
на User-Code_Page и обратно или включение UTF8 и выключение. А вот про ESC-последовательность, которая включает определённую CodePage -- не слыхал.

Не подскажите, что конкретно спрашивать у Google? В какую сторону смотреть?

Ответить | Правка | Наверх | Cообщить модератору

204. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от Seykoemail (?), 13-Май-14, 14:25 
Нашёл только в
http://search.cpan.org/~jlmorel/Win32-Console-ANSI-1.08/lib/...
(реализация ANSI в Perl для Win32)

\e(#X
# is the number of the codepage needed, 855 for cp855 for instance.
This escape sequence is not standard! It is an experimental one, just for fun :-)
  If (and only if) the console uses a Unicode police, it is possible to change its
codepage  with this escape sequence.

Все другие найденные последовательности или оперируют языками вместо CP, или
фонтами, или только для японских кодировок (стандарт для обмена сообщениями
в интернернете для японского языка)

Проблема с указанной последовательностью -- кодировки которые не имеют CodePage
типа KOI8-R. Но им тоже номера можно присвоить.

Удлиннение строки -- на 7 байт (для cp1251) вполне приемлемо..

В качестве альтернативы можно использовать данную ESC-последовательность
только в начале файла, а дальше переход на кустом-чарсет (стандарт) и обратно
(типа задаём charset для custom)

Какие другие предложения по ESC-последовательности?

PS: Касательно преимущества KOI8-R -- можно читать даже без 8 бита.

Ответить | Правка | Наверх | Cообщить модератору

126. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –2 +/
Сообщение от Тот_Самый_Анонимус (?), 11-Май-14, 14:14 
>А тратить по 4 байта на каждую английскую букву меня таки жаба давит.

Зато на кириллицу тратить лишние байты радости много.

Ответить | Правка | К родителю #69 | Наверх | Cообщить модератору

135. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 15:45 
> Зато на кириллицу тратить лишние байты радости много.

UTF-8 на нее тратит 2 байта. А уникод у которого все символы одинаковые по ширине aka UTF32 - на вообще все по 4 байта фигачит. Более компактные представления уникода или обрубки и не предоставляют весь уникодный алфавит, или variable-length encoding и прочие трюки которые так не нравятся нашему Кэпу.

Ответить | Правка | Наверх | Cообщить модератору

138. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 11-Май-14, 15:57 
пора уже перестать жалеть байты на текст. и так из-за этого до сих пор мучаемся с кучей фигни.
Ответить | Правка | Наверх | Cообщить модератору

159. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 11-Май-14, 20:43 
> пора уже перестать жалеть байты на текст. и так из-за этого до
> сих пор мучаемся с кучей фигни.

Кроме жаления байтов на текст, есть грабли с endianess (они конечно искусственные, но есть). И есть грабли с тем фактом что большинство существующих программ вот так влобовую 32-битный уникод (вроде он единственный передающий смещение напрямую без varibable length?) - не скушают. UTF8 на уровне своих свойств в плане пропихивания через программы/апи/etc - мало отличается от простого ASCII. А вот 32-битный уникод - это уже все надо переделывать. Всем лень. Но ты можешь использовать его как внутреннее представление в своих программах, никто не возражает вроде. Вот только I/O с внешним миром будет вести неудобно, потребуются конверсии там и тут.

Ответить | Правка | Наверх | Cообщить модератору

171. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от Led (ok), 11-Май-14, 23:15 
>> пора уже перестать жалеть байты на текст. и так из-за этого до
>> сих пор мучаемся с кучей фигни.
> Кроме жаления байтов на текст, есть грабли с endianess (они конечно искусственные,
> но есть).

"Проблема" с endianess сильно преувеличена. x86, armel, mipsel - LE, ppc - по факту уже тоже. Что там ещё остаётся?

Ответить | Правка | Наверх | Cообщить модератору

174. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 23:27 
> "Проблема" с endianess сильно преувеличена. x86, armel, mipsel - LE, ppc -
> по факту уже тоже. Что там ещё остаётся?

Это не значит что тебе не вынесет мозг какой-нибудь фрукт с BE вариантом проца, такие MIPS и ARM не настолько уж редки как может показаться.

Ответить | Правка | Наверх | Cообщить модератору

184. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 12-Май-14, 12:12 
> 32-битный уникод (вроде он единственный передающий смещение напрямую без varibable length?)

AFAIK, отдельные code point-ы под диакритические знаки и прочие подобные выкрутасы там тоже есть, поэтому однозначность соответствия "элемент массива <-> символ текста" UTF-32 всё равно не гарантирует.

Ответить | Правка | К родителю #159 | Наверх | Cообщить модератору

194. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 12-Май-14, 19:18 
в принципе, диакритику тоже можно считать символом. по крайней мере, с четырьмя байтами одна проблема: композиты. а с utf-8 — ещё и разбор строки.
Ответить | Правка | Наверх | Cообщить модератору

200. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 13-Май-14, 11:20 
> с четырьмя байтами одна проблема: композиты. а с utf-8 — ещё и разбор строки

С четырьмя байтами есть ещё проблема оверхеда на подавляющем большинстве текстов. И выдёргивать из строк случайные символы нужно не так часто, чтобы это преимущество UTF-32 можно было считать весомым. Там, где это действительно надо — пожалуйста, никто не мешает пользоваться четырёхбайтным юникодом, в общем же случае UTF-8 (или UTF-16 как промежуточный вариант) вполне достаточно.

Ответить | Правка | К родителю #194 | Наверх | Cообщить модератору

201. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 13-Май-14, 11:28 
посчитай оверхеды на команды процессоров и успокойся уже с оверхедом на тексты.
Ответить | Правка | К родителю #200 | Наверх | Cообщить модератору

71. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 10-Май-14, 15:59 
>> За одно это однобайнтые кодировки должны сдохнуть жестокой смертью
> а я не говорил, что должны быть именно однобайтовые. в кодировке размер
> в байтах представления символа должен быть одинаковый для всех символов, не
> более.

Ну тогда чем тебе UTF-16 не нравится?

Ответить | Правка | К родителю #65 | Наверх | Cообщить модератору

75. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 10-Май-14, 17:35 
> Ну тогда чем тебе UTF-16 не нравится?

UTF-ом. UCS — да.

Ответить | Правка | Наверх | Cообщить модератору

77. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 10-Май-14, 17:48 
Тебе только название не нравится, что ли? Ну называй ее UCS-2, если хочешь. Все равно ты их не отличишь - кириллица и латиница и там, и там кодируются совершенно одинаково.
Ответить | Правка | Наверх | Cообщить модератору

82. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 10-Май-14, 18:20 
спасибо, но я знаю разницу между UTF-16 и UCS-2.
Ответить | Правка | Наверх | Cообщить модератору

88. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 10-Май-14, 19:14 
> спасибо, но я знаю разницу между UTF-16 и UCS-2.

Рад за тебя, только от ответа-то не уходи. Сам ведь бесишься, когда люди подобным образом себя ведут. Кириллические и латинские символы одинаковой длины? Одинаковой. Так почему тогда КОИ8 "однозначно лучше" UTF-16?

Ответить | Правка | Наверх | Cообщить модератору

79. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от Аноним (-), 10-Май-14, 17:56 
> Ну тогда чем тебе UTF-16 не нравится?

Не знаю как ему, а мне не нравится тем что 2^16 всем и для всего - не хватит.

Ответить | Правка | К родителю #71 | Наверх | Cообщить модератору

86. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 10-Май-14, 19:02 
Марш читать про UTF-16. Там намного больше 2^16.
Ответить | Правка | Наверх | Cообщить модератору

89. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  –1 +/
Сообщение от Аноним (-), 10-Май-14, 19:18 
> Марш читать про UTF-16. Там намного больше 2^16.

Хм .... НО КАК ХОЛМС!?!?

Ответить | Правка | Наверх | Cообщить модератору

91. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +1 +/
Сообщение от Аноним (-), 10-Май-14, 19:28 
Так же, как и в UTF-8. UTF-16 — кодировка переменной длины.
Ответить | Правка | Наверх | Cообщить модератору

95. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 10-Май-14, 19:58 
> Ну тогда чем тебе UTF-16 не нравится?

Тем что он тоже variable length с словами 16 битов? Бонусом еще и проблемы с endianess.

Ответить | Правка | К родителю #71 | Наверх | Cообщить модератору

114. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 11-Май-14, 05:12 
пс-с-с. они не знаю про unicode 4 plane.
Ответить | Правка | Наверх | Cообщить модератору

119. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 13:18 
А в unicode 4 plane проблемы byte order не существует?
Ответить | Правка | Наверх | Cообщить модератору

121. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 11-Май-14, 13:24 
> А в unicode 4 plane проблемы byte order не существует?

проблемы «byte order» вообще не существует, она искусственная.

впрочем, тот мой комментарий был сделан потому, что я не смог в чтение того, на что ответил, и совершенно не по теме. да, со мной тоже такое бывает.

Ответить | Правка | Наверх | Cообщить модератору

131. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 15:09 
> проблемы «byte order» вообще не существует, она искусственная.

Если так подумать - все програмерские, математические и т.п. проблемы - "искусственные".

Ответить | Правка | Наверх | Cообщить модератору

133. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 11-Май-14, 15:12 
>> проблемы «byte order» вообще не существует, она искусственная.
> Если так подумать - все програмерские, математические и т.п. проблемы - "искусственные".

большинство — таки да.

Ответить | Правка | Наверх | Cообщить модератору

136. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Аноним (-), 11-Май-14, 15:46 
> большинство — таки да.

И ведь хрен оспоришь :).

Ответить | Правка | К родителю #133 | Наверх | Cообщить модератору

212. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от fi (ok), 05-Июн-14, 14:00 
> в кодировке размер
> в байтах представления символа должен быть одинаковый для всех символов, не
> более.

Зачем? это лишне.  utf8 форева! :)

или вы размер строки тупо считаете?

Ответить | Правка | К родителю #65 | Наверх | Cообщить модератору

213. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 05-Июн-14, 14:43 
> Зачем?

затем, что простые вещи должны быть простыми. работа со строками и так не самая быстрая штука, дополнительно её затормаживать нет никакого смысла.

Ответить | Правка | Наверх | Cообщить модератору

214. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от fi (ok), 05-Июн-14, 15:53 
>> Зачем?
> затем, что простые вещи должны быть простыми. работа со строками и так
> не самая быстрая штука, дополнительно её затормаживать нет никакого смысла.

А почему у вас затормаживает? что вы делаете со utf8 строкой кроме перессылки из/в файла или сети?

Ответить | Правка | Наверх | Cообщить модератору

215. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 05-Июн-14, 15:58 
> что вы делаете со utf8 строкой кроме перессылки из/в файла или сети?

много чего, господин говнокодер. но лично ты можешь не тужиться, пытаясь это выяснить, а потом осознать: у тебя череп взорвётся, а я виноватым останусь.

Ответить | Правка | Наверх | Cообщить модератору

216. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от fi (ok), 05-Июн-14, 16:23 
>> что вы делаете со utf8 строкой кроме перессылки из/в файла или сети?
> много чего,

вот-вот, "много чего" делать в этом  представлении уникода НЕ надо. учите матчасть.

наводка: wchar_t

Ответить | Правка | Наверх | Cообщить модератору

217. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 05-Июн-14, 16:26 
другая наводка: постоянная конвертация этого говна туда и обратно — операция мало того, что затратная по скорости, так она ещё затратная по памяти. потому что говноконсоль говнопингвинуса, например, не умеет в UCS. и не только она. потому что идиотский костыль повмуровывали во всё, во что получилось.
Ответить | Правка | Наверх | Cообщить модератору

218. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от Andrey Mitrofanov (?), 05-Июн-14, 16:35 
Жестокий мир?
Ответить | Правка | Наверх | Cообщить модератору

219. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 05-Июн-14, 16:37 
> Жестокий мир?

дебильный.

Ответить | Правка | К родителю #218 | Наверх | Cообщить модератору

220. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от fi (ok), 05-Июн-14, 17:12 
> другая наводка: постоянная конвертация этого говна туда и обратно — операция мало
> того, что затратная по скорости, так она ещё затратная по памяти.

да сложно в нашем мире со старьем из мира доса жить. Или это сложность z80? Помню, помню, как мы код ужимали по байтикам. Ох, давно это было. Теперь мы развращены браузером на 2Гб в памяти, и классическое преобразование транспортного и внутреннего представлении для нас #mustbe.


зы. сочувствую людям "замершим во времени"

Ответить | Правка | Наверх | Cообщить модератору

221. "Интервью с Андрем Черновым, создателем кодировки KOI8-R..."  +/
Сообщение от arisu (ok), 05-Июн-14, 17:30 
говнокодер, как и было сказано.
Ответить | Правка | К родителю #220 | Наверх | Cообщить модератору

38. "Интервью с Андрем Черновым, создателем кодировки KOI8-R и од..."  +2 +/
Сообщение от Zenitur (ok), 10-Май-14, 10:02 
Windows-1251 и CP866. И да, я понимаю что имелся в виду Юникод, просто автор "не застал".
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру