Как сохранить файл в кодировке windows 1251
Перейти к содержимому

Как сохранить файл в кодировке windows 1251

  • автор:

Перекодировка из utf-8 без BOM в windows-1251

Имеется файл в кодировке utf-8 с текстом ТОЛЬКО на латинице. Пробую с помощью notepad++ перекодировать его в windows-1251. Сохраняю, открываю заново, но файл читается все равно в кодировке utf-8 (без BOM). Вопрос: как мне сделать, чтобы файл был в кодировке windows-1251, иначе его не может использовать одна программка. И как вообще любая программа, использующая файл, определяет его кодировку? Как например тот же notepad++ может понять кодировку, если все символы в нем на латинице, а их коды совпадают и в windows-1251 и utf-8?

Собственно с чего Вы взяли, что в Вашем файле отсутствует BOM?

Если в файле текст ТОЛЬКО на латинице, то кодировки utf-8 и 1251 отличаются только наличием/отсутствием BOM’а.

Собственно то, что Вы написали про пересохранение, как раз очень похоже на добавление BOM’а.

Другой вопрос, что ни один редактор BOM Вам не отобразит. Есть некоторая надежда на редактор Far, но скорее всего и его будет не так то просто заставить отобразить эти символы.

В общем, Вам нужно удалить из файла первые два байта (ну или затереть их допустим пробелами), причем сделать это надо не в текстовом редакторе (ну или в редакторе, который не знает, что такое utf-8).

HTML кодировка страницы. В какой кодировке сохранять web-страницу? Урок №14

Бывали ли у вас ситуации, когда на web-странице вместо читабельного текста открывались кракозябры? Я уверен, что бывали или, по крайне мере, вы видели их на других сайтах. Если не видели, посмотрите на пример снизу:

HTML кодировка страницы. В какой кодировке сохранять web-страницу

Что такое HTML кодировка?
HTML кодировка – это таблицы соответствия кодов и символов алфавита. То есть, наш компьютер по кодировке поменяет код на понятные читабельные буквы.

Что такое HTML кодировка?

Популярные кодировки.
На сегодняшний день существуют две самые популярные кодировки в русскоязычном интернете. Это кодировка windows-1251 и utf-8. Частенько веб-мастерам приходится выбирать, в какой кодировке делать им веб-страничку.

В какой кодировке следует сохранять HTML файл?
Большинство веб-мастеров выбирают кодировку utf-8. И это верный выбор, так как в кодировке utf-8 имеются различные знаки ( ↓↑ и т. д.), а также есть масса разнообразных специфических символов. Кстати, основная часть движков, как Joomla, WordPress, Drupal работает на кодировке utf-8.

Поэтому я рекомендую вам сохранять HTML файлы в кодировке utf-8 .

Как задать кодировку UTF-8 для файла?
Чтобы задать кодировку для HTML файла, используют различные редакторы. Я пользуюсь текстовым редактором Notepad++.
Откройте текстовый редактор Notepad++.
Если нужно, создайте новый документ.
Перейдите в меню сверху по вкладке « Кодировки » => « Кодировать в UTF-8 (без BOM) »:

Как задать кодировку UTF-8 для файла?

Чтобы сообщить браузеру, в какой кодировке HTML файл, существует специальный META-тег

В HTML документе это будет выглядеть вот так:

Как задать кодировку windows-1251 для файла?
Откройте текстовый редактор Notepad++.
Если нужно, создайте новый документ.
Перейдите в меню сверху по вкладке « Кодировки » => « Кодировать в ANSI »:

Как задать кодировку windows-1251 для файла?

Чтобы сообщить браузеру, в какой кодировке HTML файл, существует специальный META-тег

В HTML документе это будет выглядеть вот так:

Пример перекодировки файла из windows-1251 в utf-8
Если в HTML документе был прописан код в кодировке windows-1251 (ANSI), а вам нужно перекодировать на utf-8 (или на оборот), тогда сделайте так:
Откройте текстовый редактор Notepad++. В текстовом редакторе перейдите в меню сверху по вкладке « Кодировки » => « Преобразовать в UTF-8 (без BOM) »:

Пример перекодировки файла из windows-1251 в utf-8

Внимание , если бы вы нажали « Кодировать в UTF-8 (без BOM) », то в результате вы бы увидели вместо любимого русского текста, красивые караказябли .

Как изменить кодировку текстового файла на UTF-8 или Windows 1251

Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).

Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.

В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.

Блокнот Windows

Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню « Файл – Сохранить как ».

меню Файл – Сохранить как

В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку « Сохранить ».

изменить кодировку в Блокноте

К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.

Notepad++

Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.

Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню « Кодировки – Кириллица » и выбрать нужный вариант.

выбрать кодировку в Notepad++

После открытия текста можно изменить его кодировку. Для этого нужно открыть меню « Кодировки » и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.

изменить кодировку в Notepad++

После преобразования файл нужно сохранить с помощью меню « Файл – Сохранить » или комбинации клавиш Ctrl-S.

Akelpad

Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.

Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню « Файл – Открыть ».

открыть файл в Akelpad

В открывшемся окне нужно выделить текстовый файл, снять отметку « Автовыбор » и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.

выбрать кодировку в Akelpad

Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню « Файл – Сохранить как » и сохранить документ с указанием новой схемы кодирования.

изменить кодировку в Akelpad

В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.

  • Чем открыть PDF файл в Windows 7 или Windows 10
  • Как перевернуть страницу в Word
  • Как копировать текст с помощью клавиатуры
  • Как сделать рамку в Word
  • Как сделать буклет в Word

Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.

Задайте вопрос в комментариях под статьей или на странице «Задать вопрос» и вы обязательно получите ответ.

и снова кодировка текстового файла

Здравствуйте!
я уж и СП посмотрел, и форумы прошерстил — везде один и тот же ответ — при записи устанавливать тип файла. Ну, устанавливаю я, не идиот же:

Текст = Новый ТекстовыйДокумент;
Текст.УстановитьТипФайла("windows-1251");
ИмяФайла = "2344_" + Формат(Дата, "ДФ=гггг") + "-" + Формат(Дата, "ДФ=ММ") + "-" + Формат(Дата, "ДФ=дд") + ".csv";
Текст.ДобавитьСтроку("OPERATION_DATE;AMOUNT;TRANSACTION_ID;INVOICE_ID;PAYMENT_TYPE;TICKET_ID;TERMINAL_ID;GATE_TRANSACTION_ID");
Пока Результат.Следующий() Цикл
ДатаСтр = МойФормат(НайтиЗначениеПараметра(Результат.Приложение, "TICKET_REGISTRATION_TIME"));
СуммаСтр = Формат(Число(НайтиЗначениеПараметра(Результат.Приложение, "PRICE_RETURNED")) / 100, "ЧДЦ=2; ЧРД=.; ЧГ=0");
Транзакция = НайтиЗначениеПараметра(Результат.Приложение, "EXTERNAL_TRANSACTION_ID");
Инвойс = "";
ТипПлатежа = "zemlianuhin";
Билет = НайтиЗначениеПараметра(Результат.Приложение, "TICKET_ID");
Терминал = НайтиЗначениеПараметра(Результат.Приложение, "TERMINAL_ID");
Гейт = "";
Текст.ДобавитьСтроку(ДатаСтр + ";" + СуммаСтр + ";" + Транзакция + ";" + Инвойс + ";" + ТипПлатежа + ";" + Билет + ";" + Терминал + ";" + Гейт);
КонецЦикла;
Текст.Записать(Кат + ИмяФайла, "windows-1251");

Но все-равно, открываешь потом файл, например, программой Notepad++ и в правом нижнем углу показывает кодировку UTF-8, да и заказчик тоже присылает письмо, что это UTF-8, а ему надо Win1251.

Подскажите, пожалуйста, в чем дело.

(1) нет, то же самое (только заказчику не отправлял).

попробую по-другому сформулировать — а как точно посмотреть кодировку файла? может мне программа notepad++ врет?

ладно, отправил заказчику следующее письмо:

Добрый день, Сергей.

Вот файл. Несмотря на одинаковые названия, это новый файл, я сгенерировал его только что.
Я уверен, что этот файл в кодировке windows-1251. Но Notepad++ все-равно показывает UTF-8.
Текстовый редактор Notepad++ не умеет правильно определять кодировку.
Для примера можно сделать следующее: создать файл в Notepad++ в кодировке windows-1251,
ввести какой либо текст и сохранить. Потом обязательно ЗАКРЫТЬ этот файл, а затем
заново открыть. Если в тексте были только латинские буквы (кроме цифр), то Notepad++
покажет Вам кодировку UTF-8, а если были еще и русские, то покажет ANSI.
Я смотрю во встроенном просмотрщике Тотал-командера, мне показывает windows-1251.

Ф = ПолучитьИмяВременногоФайла("csv");
ТД = Новый ТекстовыйДокумент;
ТД.УстановитьТипФайла(КодировкаТекста.ANSI);
ТД.ДобавитьСтроку("строка");
ТД.ДобавитьСтроку("строка2");
ТД.Записать(Ф, КодировкаТекста.ANSI);
Сообщить(Ф);

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *