在Linux系统中修改文本的字符编码的方法

快乐时尚的我

快乐时尚的我

2016-03-31 15:29

给自己一点时间接受自己,爱自己,趁着下午茶的时间来学习图老师推荐的在Linux系统中修改文本的字符编码的方法,过去的都会过去,迎接崭新的开始,释放更美好的自己。

在Linux系统中修改文本的字符编码的方法

   正如我们所知道的那样,电脑只能够处理低级的二进制值,并不能直接处理字符。当一个文本文件被存储时,文件中的每一个字符都被映射成二进制值,实际存储在硬盘中的正是这些二进制值。之后当程序打开文本文件时,所有二进制值都被读入并映射回原始的可读字符。只有当所有需要访问这个文件的程序都能够理解它的编码,即二进制值到字符的映射时,这个保存和打开的过程才能很好地完成,这也确保了可理解数据的往返过程。

  如果不同的程序使用不同的编码来处理同一个文件,源文件中的特殊字符就无法正常显示。这里的特殊字符指的是非英文字母的字符,例如带重音的字符(比如 ?,á,ü)。

  然后问题就来了: 1)我们如何确定一个确定的文本文件使用的是什么字符编码? 2)我们如何把文件转换成已选择的字符编码?

  步骤一

(本文来源于图老师网站,更多请访问https://m.tulaoshi.com/fuwuqi/)

  为了确定文件的字符编码,我们使用一个名为 file 的命令行工具。因为 file 命令是一个标准的 UNIX 程序,所以我们可以在所有现代的 Linux 发行版中找到它。

  运行下面的命令:

  代码如下:

  $ file --mime-encoding filename

2015617180329059.jpg (378×122)

  步骤二

  下一步是查看你的 Linux 系统所支持的文件编码种类。为此,我们使用名为 iconv 的工具及 -l 选项(L 的小写)来列出所有当前支持的编码。

(本文来源于图老师网站,更多请访问https://m.tulaoshi.com/fuwuqi/)

  代码如下:

  $ iconv -l

  iconv 工具是 GNU libc 库组成部分,因此它在所有 Linux 发行版中都是开箱即用的。

  步骤三

  在我们在我们的 Linux 系统所支持的编码里面选定了目标编码之后,运行下面的命令来完成编码转换:

  代码如下:

  $ iconv -f old_encoding -t new_encoding filename

  例如,把 iso-8859-1 编码转换为 utf-8 编码:

  代码如下:

  $ iconv -f iso-8859-1 -t utf-8 input.txt

2015617180351168.png (451×129)

  了解了我们演示的如何使用这些工具之后,你可以像下面这样修复一个受损的字幕文件:

2015617180409006.jpg (640×302)
展开更多 50%)
分享

猜你喜欢

在Linux系统中修改文本的字符编码的方法

服务器
在Linux系统中修改文本的字符编码的方法

在Linux系统中安装iotop命令的方法

电脑入门
在Linux系统中安装iotop命令的方法

s8lol主宰符文怎么配

英雄联盟 网络游戏
s8lol主宰符文怎么配

Linux系统中tr命令删除和替换文本字符的基本用法

服务器
Linux系统中tr命令删除和替换文本字符的基本用法

AJAX在GB2312的中文编码传输 AJAX特殊字符编码正确方法

Web开发
AJAX在GB2312的中文编码传输 AJAX特殊字符编码正确方法

lol偷钱流符文搭配推荐

英雄联盟 网络游戏
lol偷钱流符文搭配推荐

在Linux系统中检查glibc版本信息的方法

服务器
在Linux系统中检查glibc版本信息的方法

Linux系统中如何修改网卡DNS?

电脑入门
Linux系统中如何修改网卡DNS?

lolAD刺客新符文搭配推荐

英雄联盟
lolAD刺客新符文搭配推荐

2345浏览器怎么恢复误关闭的网页

2345浏览器怎么恢复误关闭的网页

Fedora如何设置一键显示桌面?

Fedora如何设置一键显示桌面?
下拉加载更多内容 ↓