-
05.08.2024, 00:42 #136
- Регистрация
- 18.03.2013
- Возраст
- 38
- Сообщений
- 877
- Поблагодарили
- 269
- Поблагодарил
- 936
ASCII не предусматривает букв европейских алфавитов - умляутов и прочего.
То, о чём вы говорите - это так называемый Extended character set - символы с 80 до FF в шестнадцатеричной кодировке. И уже внутри этого самого пространства разные организации и фирмы напридумывали свои европейские и кириллические кодировки - ISO-8859-*, CP8**, WIN12**.R2DAW
-
05.08.2024, 01:18 #137
- Регистрация
- 03.02.2006
- Возраст
- 52
- Сообщений
- 18,724
- Поблагодарили
- 8994
- Поблагодарил
- 4772
И какой из этого вывод?
73 de RX4HX, Alexei, http://rx4hx.qrz.ru
Ant.: UW4HW, Pwr.: ~500 Wtts
-
05.08.2024, 11:04 #138
- Регистрация
- 18.01.2003
- Адрес
- Кишинёв
- Возраст
- 53
- Сообщений
- 4,618
- Поблагодарили
- 1949
- Поблагодарил
- 8413
Полагаю такой же как и ввод - CP866, CP1251, KOI8 и прочие ещё более многочисленные нерусские но локализованные - все являются вариантами расширенного ASCII, где вместо псевдографики вставили национальные символы.
Если в стандарте не описано - значит каждый применяет кодовую таблицу на свой вкус. 866 уже не актуальна, KOI под винду тоже не родная - в итоге остаётся либо CP1251 либо юникод. Юникод более универсален, но это ж на выбор. Для БД под многоязычные логи на сервере я б скорее всего юникод применил. Или просто игнорировал бы при импорте в бд все записи которые не на латинице.
-
05.08.2024, 12:05 #139
- Регистрация
- 28.02.2023
- Возраст
- 39
- Сообщений
- 263
- Поблагодарили
- 153
- Поблагодарил
- 128
Шел 2024 год, а некоторые настойчиво продолжали пытаться засунуть в унифицированный формат записей лога с унифицированным временем национальные кодировки... Юникод спасет мир. Если ваш логер пишет адифку не в юникоде (можно и аски, но это уже мелочь, ибо юникод обратно совместим с этой таблицей), то выбросите этот логер и никогда больше к нему не возвращайтесь.
Ну либо себе, вроде здоровому, ищите костыли в виде пересохранения в юникод.
Разработчики лоградио, кмк, должны большой красной строкой выдавать предупреждение и счетчик: мы приняли ваш журнал в 1251 уже 1 раз, у вас еще 2 попытки. После этого журнал будет приниматься только в юникоде.
-
05.08.2024, 12:17 #140
- Регистрация
- 18.01.2003
- Адрес
- Кишинёв
- Возраст
- 53
- Сообщений
- 4,618
- Поблагодарили
- 1949
- Поблагодарил
- 8413
Последний раз редактировалось ER1CS; 05.08.2024 в 12:24.
-
05.08.2024, 12:47 #141
- Регистрация
- 03.02.2006
- Возраст
- 52
- Сообщений
- 18,724
- Поблагодарили
- 8994
- Поблагодарил
- 4772
73 de RX4HX, Alexei, http://rx4hx.qrz.ru
Ant.: UW4HW, Pwr.: ~500 Wtts
-
06.08.2024, 02:57 #142
- Регистрация
- 18.03.2013
- Возраст
- 38
- Сообщений
- 877
- Поблагодарили
- 269
- Поблагодарил
- 936
Вывод - создатели оригинального ADIF забили на все языки, кроме английского. Потом очухались и сделали ADX, про который я узнал только вчера и с ходу не назову логгер или российский онлайн-сервис, который его поддерживает.
ИМХО, я бы использовал 1251 для кириллицы, просто потому, что она стала де-факто в "народном" UR5EQF Log.
Я, кстати, понял, почему в оригинальном ADIF официально не поддерживается Юникод. Из-за счётчика символов.в теге. Т.е в ASCII каждому символу соответствует байт, за счёт этого ставится число в счётчик. А в UTF-8, в той части, которая за пределами Extended character set - это будет уже минимум два.R2DAW
-
06.08.2024, 07:33 #143
-
06.08.2024, 10:21 #144
- Регистрация
- 03.02.2006
- Возраст
- 52
- Сообщений
- 18,724
- Поблагодарили
- 8994
- Поблагодарил
- 4772
Используется DOS-кодировка ACSII. Русские символы - опять же из DOS-кодировки ACSII. Т.е. как и написано в документации для ADIF -
Character - an ASCII character whose code lies in the range of 32 through 126, inclusive
но русские символы сюда не попадают по стандарту.
- - - Добавлено - - -
Да именно по этому. А еще по тому, что формат Адиф изначально был создан мягко скажем.... не самым удобным для программистов.
Я про этот формат знаю давно, но не слышал, чтоб какая то программ или сервис его использовали бы.73 de RX4HX, Alexei, http://rx4hx.qrz.ru
Ant.: UW4HW, Pwr.: ~500 Wtts
-
06.08.2024, 10:33 #145
- Регистрация
- 18.01.2003
- Адрес
- Кишинёв
- Возраст
- 53
- Сообщений
- 4,618
- Поблагодарили
- 1949
- Поблагодарил
- 8413
Для латиницы вообще нет разницы, какая кодировка используется. Для семибитной телетайпной передачи изначально применялось 127 значений, среди которых буквы латиницы, цифры и спецсимволы. Все прочие языки и символы псевдографики начали добавлять в расширенный, восьмибитный ASCII, в позиции 127-254. На латиницу это никак не влияет.
-
06.08.2024, 11:54 #146
- Регистрация
- 03.02.2006
- Возраст
- 52
- Сообщений
- 18,724
- Поблагодарили
- 8994
- Поблагодарил
- 4772
73 de RX4HX, Alexei, http://rx4hx.qrz.ru
Ant.: UW4HW, Pwr.: ~500 Wtts
-
06.08.2024, 12:03 #147
- Регистрация
- 14.05.2018
- Адрес
- Санкт-Петербург
- Возраст
- 61
- Сообщений
- 798
- Поблагодарили
- 651
- Поблагодарил
- 231
Стандарт ADIF создавался в те далекие времена, когда компьютеры были большими, а программы - маленькими Теперь мы все понимаем, что в этой карете прошлого далеко не уедешь. Но изменить стандарт ADIF "силовым" путем - нереально. Поэтому придется смириться с тем, что разные логгеры будут отдавать символы 0x80...0xFF по-разному.
Любой онлайн-ресурс ("хранилище логов") должен тупо принять символы так, как ему их отдали. И только хранить, ничего больше. И отдать по запросу ровно так же, как ему их залили. А интерпретация символов и их представление на национальных языках - это функционал пользовательского софта на рабочем месте пользователя (радиолюбителя).73, Влад RM1F
-
06.08.2024, 13:14 #148
- Регистрация
- 03.02.2006
- Возраст
- 52
- Сообщений
- 18,724
- Поблагодарили
- 8994
- Поблагодарил
- 4772
На самом деле нашли проблему там, где ее нет! На Хамлоге все прекрасно отображается на русском.
Да, если вместо того, чтоб делать дело, начинать искать проблемы - обязательно их найдешь!
Да изначально ASCII - это 7 бит. Но на компьютерах изначально оперировали 1-байтными символами и по этому русские символы в расширенную таблицу ASCII отлично вписываются.
Никто формат Адиф менять не будет! Использует то, что есть. На этом предлагаю обсуждение формата Адиф закончить.73 de RX4HX, Alexei, http://rx4hx.qrz.ru
Ant.: UW4HW, Pwr.: ~500 Wtts
-
06.08.2024, 13:34 #149
-
06.08.2024, 14:03 #150
- Регистрация
- 18.03.2013
- Возраст
- 38
- Сообщений
- 877
- Поблагодарили
- 269
- Поблагодарил
- 936
Я очень удивился, погуглив и узнав, что первая спецификация ADIF появилась... в 1996-м! Не такие уж и далёкие времена (первый Pentium), не такие уж и большие компьютеры.
И проблема кодировок в то время, в связи с распространением Интернета в Восточной Европе и бывш. СССР, уже во всю себя показывала.R2DAW
Социальные закладки