КАТАЛОГ АУДИОКНИГ
Исполнители
Рецензии
Название
Клуб в социальных сетях: |
Проблемы с кодировкой текста. Да будут русские буквы!Допустим, у нас есть некий текст, отображающийся в текстовом редакторе так называемыми крякозяблями. Например, вот так: вПЗЙ ДБМЙ ОБН ЧТЕНС ХВЙЧБФШ ЧТБЗПЧ Й ЧТЕНС ЪБЧПДЙФШ ДТХЪЕК, ЧТЕНС РЙФШ НПМПДПЕ ЧЙОП Й ЧТЕНС МАВЙФШ РТЕЛТБУОЩИ ЦЕОЭЙО, ЧТЕНС УПЧЕТЫБФШ ЗМХРПУФЙ Й ЧТЕНС ЙИ ЙУРТБЧМСФШ б ЕЭЕ ПОЙ ДБМЙ ОБН ЧТЕНС ПУФБОПЧЙФШУС Й РПДХНБФШ ЪБЮЕН НЩ ЧУЕ ЬФП ДЕМБЕН?.. фБЛ ЧЩРШЕН ЦЕ ЪБ ФП, ЮФПВЩ ПОЙ ЪБВТБМЙ ЕЗП ПВТБФОП!!! зПТУЛЙК ФПУФ или ещё страшнее: £÷ђЈ ¶†–Ј ‘†“ лб®“ё 祣л†ен лб†ђ÷л Ј лб®“ё у†л÷¶Јен ¶бзу®љ, лб®“ё ЎЈен “÷–÷¶÷® лЈ‘÷ Ј лб®“ё –ЬҐЈен Ўб®∆б†г‘сµ й®‘щЈ‘, лб®“ё г÷л®бх†ен ђ–зЎ÷геЈ Ј лб®“ё Јµ ЈгЎб†л–ёен ° ®щ® ÷‘Ј ¶†–Ј ‘†“ лб®“ё ÷г冑÷лЈенгё Ј Ў÷¶з“†ен у†ы®“ “с лг® че÷ ¶®–†®“?.. ж†∆ лсЎн®“ й® у† е÷, ые÷Ґс ÷‘Ј у†Ґб†–Ј ®ђ÷ ÷Ґб†е‘÷!!! ≠÷бг∆Јљ е÷ге Файлик есть, а прочитать его нет возможности. Такой текст образуется из-за проблем с кодировкой букв русского али ещё какого «не английского» языка, с аглицким проблем почти не бывает. Кодировка — слово-то какое, так сказать, способ соответствия последовательности циферок, нулей и единичек, и уникальных графем языка. «Красивее» объясняется на википедии: Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере). Путеводитель по интернету: Для начала немного посчитаем. Помните, что такое бит? Это минимальный носитель информации, ноль или один. А байт содержит восемь битов. Сколько может быть комбинаций из нулей и единиц длины 8? Ответ - 2*2*2*2*2*2*2*2=256. Именно столько значений может принимать один байт. Иногда еще байт называют символом - потому что как раз для кодировки символа и стали использовать один байт. Даже меньше, изначально была придумана кодировка ASCII, которая использовала 7 битов - в первые 128 значений можно было вольготно разместить английский алфавит в обоих регистрах, диакритические знаки, цифры и набор спец-символов. И эта кодировка действительно стала универсальной, поэтому англоязычные пользователи крайне редко могут испытывать проблемы с кодировкой. Перейдем к кириллице. Для нее стали использовать вторую половину кодовой таблицы - символы 129-256. Однако так сложилось, что различные кодировки были изобретены независимо - одни изобретатели располагали буквы, стремясь к соответствию расположения на пишущих машинках, другие - к тому, чтобы одинаково выглядящие кириллические и латинские буквы находились на расстоянии в 128 (что приводило к тому, что даже программы, не умевшие работать со второй половиной таблицы, более-менее читаемо отображали русский текст). Были и другие идеи; появление Windows также принесло свою кодировку. Но главное, такая кодировка принципиально не могла стать универсальной, так как если латиница была нужна везде (хотя бы для командной строки), то кириллица была лишь одним из национальных алфавитов. Какими бывают кодировки? Разными, страшными, запутанными и даже шестнадцатибитными. Знать их все совершенно нет надобности. В русской версии операционной системы Microsoft Windows по умолчанию принят набор символов Windows-1251. Ещё есть КОИ-8 и Юникод, универсальный и вездесущий. Хотите, чтобы ваш текст увидели без проблем, сохраняйте файлы в юникоде. Материал подготовлен при поддержке образовательного учреждения "Интеллигент" - ваш репетитор финского Решение разИспользуем «правильные» текстовые редакторы, способные самостоятельно конвертировать кодировки и поставлять пользователю читаемый текст. Примеры для windows:
Notepad-плюс-плюс (бесплатный, лицензия GNU GPL) да тот же Microsoft Word из пакета Microsoft Office есть у многих или его бесплатный аналог LibreOffice (бывший OpenOffice) Примеры для других систем смотри опять же на вики. Решение два Используем онлайн-конвертеры текста. Открываем исходный текст хоть в блокноте, хоть в читалке, копируем его либо целиком, если он занимает не слишком много килобайт, либо кусками и вставляем его в поле ввода на сайте конвертера. Например:
Ещё знаю online-decoder.com Боги дали нам время убивать врагов и время заводить друзей, время пить молодое вино и время любить прекрасных женщин, время совершать глупости и время их исправлять… А еще они дали нам время остановиться и подумать – зачем мы все это делаем?.. Так выпьем же за то, чтобы они забрали его обратно!!! © sumnix :: Клуб Любителей Аудиокниг :: www.abook-club.ru
|
||||||||
О клубе
::
Ресурсы
::
Правообладателям
::
Обратная связь
::
ЧаВо
::
Полезно
::
Форум
Анклавы Клуба в социальных сетях: подписаться на почтовую рассылку
abook-club.ru
©
2004-2021
Дизайн: yuriy12, Alexxus, Верстка: gracer, Поддержка каталога: vTinka & co Администрирование сервиса: nicksu, Выборочная корректура: smb46 Программирование: Виталий Ляпота (a.k.a. Vitalik) |