Клуб Любителей Аудиокниг
 
КАТАЛОГ АУДИОКНИГ
Исполнители
Авторы
Рецензии
Название
Список исполнителей на букву:
Поиск исполнителей:
НАЙТИ!
Список рецензий на букву:
Поиск рецензий:
НАЙТИ!
Список авторов на букву:
Поиск авторов:
НАЙТИ!
Список аудиокниг на букву:
Поиск аудиокниг:
НАЙТИ!





Хотите подписаться на наши обновления?


Клуб в социальных сетях:
официальный паблик  Клуба любителей аудиокниг вКонтакте  Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм




Проблемы с кодировкой текста. Да будут русские буквы!

проблемы с кодировкой

Допустим, у нас есть некий текст, отображающийся в текстовом редакторе так называемыми крякозяблями. Например, вот так:
вПЗЙ ДБМЙ ОБН ЧТЕНС ХВЙЧБФШ ЧТБЗПЧ Й ЧТЕНС ЪБЧПДЙФШ ДТХЪЕК, ЧТЕНС РЙФШ НПМПДПЕ ЧЙОП Й ЧТЕНС МАВЙФШ РТЕЛТБУОЩИ ЦЕОЭЙО, ЧТЕНС УПЧЕТЫБФШ ЗМХРПУФЙ Й ЧТЕНС ЙИ ЙУРТБЧМСФШ б ЕЭЕ ПОЙ ДБМЙ ОБН ЧТЕНС ПУФБОПЧЙФШУС Й РПДХНБФШ ЪБЮЕН НЩ ЧУЕ ЬФП ДЕМБЕН?.. фБЛ ЧЩРШЕН ЦЕ ЪБ ФП, ЮФПВЩ ПОЙ ЪБВТБМЙ ЕЗП ПВТБФОП!!! зПТУЛЙК ФПУФ

или ещё страшнее:

£÷ђЈ ¶†–Ј ‘†“ лб®“ё 祣л†ен лб†ђ÷л Ј лб®“ё у†л÷¶Јен ¶бзу®љ, лб®“ё ЎЈен “÷–÷¶÷® лЈ‘÷ Ј лб®“ё –ЬҐЈен Ўб®∆б†г‘сµ й®‘щЈ‘, лб®“ё г÷л®бх†ен ђ–зЎ÷геЈ Ј лб®“ё Јµ ЈгЎб†л–ёен ° ®щ® ÷‘Ј ¶†–Ј ‘†“ лб®“ё ÷г冑÷лЈенгё Ј Ў÷¶з“†ен у†ы®“ “с лг® че÷ ¶®–†®“?.. ж†∆ лсЎн®“ й® у† е÷, ые÷Ґс ÷‘Ј у†Ґб†–Ј ®ђ÷ ÷Ґб†е‘÷!!! ≠÷бг∆Јљ е÷ге

Файлик есть, а прочитать его нет возможности. Такой текст образуется из-за проблем с кодировкой букв русского али ещё какого «не английского» языка, с аглицким проблем почти не бывает. Кодировка — слово-то какое, так сказать, способ соответствия последовательности циферок, нулей и единичек, и уникальных графем языка.

«Красивее» объясняется на википедии:
Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).

Путеводитель по интернету:
Для начала немного посчитаем. Помните, что такое бит? Это минимальный носитель информации, ноль или один. А байт содержит восемь битов. Сколько может быть комбинаций из нулей и единиц длины 8? Ответ - 2*2*2*2*2*2*2*2=256. Именно столько значений может принимать один байт. Иногда еще байт называют символом - потому что как раз для кодировки символа и стали использовать один байт. Даже меньше, изначально была придумана кодировка ASCII, которая использовала 7 битов - в первые 128 значений можно было вольготно разместить английский алфавит в обоих регистрах, диакритические знаки, цифры и набор спец-символов. И эта кодировка действительно стала универсальной, поэтому англоязычные пользователи крайне редко могут испытывать проблемы с кодировкой.

Перейдем к кириллице. Для нее стали использовать вторую половину кодовой таблицы - символы 129-256. Однако так сложилось, что различные кодировки были изобретены независимо - одни изобретатели располагали буквы, стремясь к соответствию расположения на пишущих машинках, другие - к тому, чтобы одинаково выглядящие кириллические и латинские буквы находились на расстоянии в 128 (что приводило к тому, что даже программы, не умевшие работать со второй половиной таблицы, более-менее читаемо отображали русский текст). Были и другие идеи; появление Windows также принесло свою кодировку. Но главное, такая кодировка принципиально не могла стать универсальной, так как если латиница была нужна везде (хотя бы для командной строки), то кириллица была лишь одним из национальных алфавитов.


Какими бывают кодировки? Разными, страшными, запутанными и даже шестнадцатибитными. Знать их все совершенно нет надобности. В русской версии операционной системы Microsoft Windows по умолчанию принят набор символов Windows-1251. Ещё есть КОИ-8 и Юникод, универсальный и вездесущий.
Хотите, чтобы ваш текст увидели без проблем, сохраняйте файлы в юникоде.
Материал подготовлен при поддержке образовательного учреждения
"Интеллигент" - ваш репетитор финского
Решение раз
Используем «правильные» текстовые редакторы, способные самостоятельно конвертировать кодировки и поставлять пользователю читаемый текст.
Примеры для windows:
    EmEditor (платный, ~$40, но денег своих сто́ит)
    Notepad-плюс-плюс (бесплатный, лицензия GNU GPL)
    да тот же Microsoft Word из пакета Microsoft Office есть у многих
    или его бесплатный аналог LibreOffice (бывший OpenOffice)
— все поддерживают множество кодировок и имеют русский интерфейс.
Примеры для других систем смотри опять же на вики.

Решение два
Используем онлайн-конвертеры текста. Открываем исходный текст хоть в блокноте, хоть в читалке, копируем его либо целиком, если он занимает не слишком много килобайт, либо кусками и вставляем его в поле ввода на сайте конвертера.
Например:
    болгарский сайт 2cyr.com обладает весьма богатыми функциями, вплоть до кодирования в base64
    Ещё знаю online-decoder.com
Текст означает всего лишь «Горский тост» из одной книжки:
Боги дали нам время убивать врагов и время заводить друзей, время пить молодое вино и время любить прекрасных женщин, время совершать глупости и время их исправлять… А еще они дали нам время остановиться и подумать – зачем мы все это делаем?.. Так выпьем же за то, чтобы они забрали его обратно!!!

© sumnix :: Клуб Любителей Аудиокниг :: www.abook-club.ru



Аудиокнига: Левонтина Ирина - О чем речь
Автор: Левонтина Ирина
Название: О чем речь
Исполнитель: Чигинская Галина
Жанр: Языкознание
Издательство: Аудиокнига
Год издания: 2016
Прочитано по изданию: ООО “Издательство АСТ”, 2016 Издательство CORPUS ®
Качество: mp3, cbr, 128 kbps, 44 kHz, Joint Stereo
Размер: 701,21 MB
Длительность: 12:42:41
Описание:
Ирина Левонтина – известный ученый-лингвист, ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН, автор словарей и блестящих статей, популяризатор лингвистики, специалист по судебной лингвистической экспертизе. Автор книги “Русский со словарем”, в 2011 году ставшей финалистом премии “Просветитель”, колумнист газеты “Троицкий вариант – Наука”.
“О чем......


О клубе :: Ресурсы :: Правообладателям :: Обратная связь :: ЧаВо :: Полезно :: Форум

Анклавы Клуба в социальных сетях:
официальный паблик  Клуба любителей аудиокниг вКонтакте  Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм  
подписаться на почтовую рассылку

abook-club.ru 2004-2017
Дизайн: yuriy12, Alexxus, Верстка: gracer, Поддержка каталога: vTinka & co
Администрирование сервиса: nicksu, Выборочная корректура: smb46
Программирование: Виталий Ляпота (a.k.a. Vitalik)
карта сайта