2
2
3
3
如果你用一般的文字编辑器阅览这份文件, 请忽略文中奇特的注记字符.
4
4
这份文件是以 POD (简明文件格式) 写成; 这种格式是为了能让人直接阅读,
5
- 而特别设计的. 关于此格式的进一步信息, 请参考 perlpod 线上文件 .
5
+ 而特别设计的. 关于此格式的进一步信息, 请参考 perlpod 在线文档 .
6
6
7
7
=head1 NAME
8
8
@@ -12,36 +12,36 @@ perlcn - 简体中文 Perl 指南
12
12
13
13
欢迎来到 Perl 的天地!
14
14
15
- 从 5.8.0 版开始, Perl 具备了完善的 Unicode (统一码) 支援 ,
16
- 也连带支援了许多拉丁语系以外的编码方式 ; CJK (中日韩) 便是其中的一部份 .
15
+ 从 5.8.0 版开始, Perl 具备了完善的 Unicode (统一码) 支持 ,
16
+ 也连带支持了许多拉丁语系以外的编码方式 ; CJK (中日韩) 便是其中的一部分 .
17
17
Unicode 是国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界,
18
- 以及两者间的一切 (希腊文, 叙利亚文, 亚拉伯文 , 希伯来文, 印度文,
19
- 印地安文, 等等). 它也容纳了多种作业系统与平台 (如 PC 及麦金塔).
18
+ 以及两者间的一切 (希腊文, 叙利亚文, 阿拉伯文 , 希伯来文, 印度文,
19
+ 印地安文, 等等). 它也容纳了多种操作系统与平台 (如 PC 及麦金塔).
20
20
21
21
Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字符串数据可用 Unicode
22
- 表示; Perl 的函式与算符 (例如正规表示式比对 ) 也能对 Unicode 进行操作.
23
- 在输入及输出时, 为了处理以 Unicode 之前的编码方式存放的数据 , Perl
24
- 提供了 Encode 这个模块, 可以让你轻易地读取及写入旧有的编码数据 .
22
+ 表示; Perl 的函数与运算符 (例如正则表达式匹配 ) 也能对 Unicode 进行操作.
23
+ 在输入及输出时, 为了处理以 Unicode 之前的编码方式储存的数据 , Perl
24
+ 提供了 Encode 这个模块, 可以让你轻易地读写使用旧有的编码格式的数据 .
25
25
26
- Encode 延伸模块支援下列简体中文的编码方式 ('gb2312' 表示 'euc-cn'):
26
+ Encode 扩展模块支持下列简体中文的编码方式 ('gb2312' 表示 'euc-cn'):
27
27
28
- euc-cn Unix 延伸字符集 , 也就是俗称的国标码
28
+ euc-cn Unix 扩展字符集 , 也就是俗称的国标码
29
29
gb2312-raw 未经处理的 (低比特) GB2312 字符表
30
30
gb12345 未经处理的中国用繁体中文编码
31
31
iso-ir-165 GB2312 + GB6345 + GB8565 + 新增字符
32
32
cp936 字码页 936, 也可以用 'GBK' (扩充国标码) 指明
33
33
hz 7 比特逸出式 GB2312 编码
34
34
35
- 举例来说, 将 EUC-CN 编码的档案转成 Unicode, 祗需键入下列指令 :
35
+ 举例来说, 将 EUC-CN 编码的文件转成 Unicode, 只需输入以下命令 :
36
36
37
37
perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
38
38
39
- Perl 也内附了 "piconv", 一支完全以 Perl 写成的字符转换工具程序, 用法如下:
39
+ Perl 也内附了 "piconv", 一个完全以 Perl 写成的字符转换工具程序, 用法如下:
40
40
41
41
piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
42
42
piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
43
43
44
- 另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码 , 如下所示:
44
+ 另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的代码 , 如下所示:
45
45
46
46
#!/usr/bin/env perl
47
47
# 启动 euc-cn 字串解析; 标准输出入及标准错误都设为 euc-cn 编码
@@ -53,7 +53,7 @@ Perl 也内附了 "piconv", 一支完全以 Perl 写成的字符转换工具程
53
53
54
54
在最后一列例子里, "谆" 的第二个字节与 "谆" 的第一个字节结合成 EUC-CN
55
55
码的 "蛔"; "谆" 的第二个字节则与 "教" 的第一个字节结合成 "唤".
56
- 这解决了以前 EUC-CN 码比对处理上常见的问题 .
56
+ 这解决了以前 EUC-CN 码匹配处理上常见的问题 .
57
57
58
58
=head2 额外的中文编码
59
59
@@ -67,7 +67,7 @@ Encode::HanExtra 模块. 它目前提供下列编码方式:
67
67
big5-simp Big5 繁体中文与 Unicode 简体中文互转
68
68
gbk-trad GBK 简体中文与 Unicode 繁体中文互转
69
69
70
- 若想在 GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两支程序 ,
70
+ 若想在 GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两个程序 ,
71
71
或在程序内使用下列写法:
72
72
73
73
use Encode::HanConvert;
@@ -93,7 +93,7 @@ Perl 的首页
93
93
94
94
=item L<https://www.perl.com/>
95
95
96
- 由 Perl 基金会所营运的文章辑录
96
+ 由 Perl 基金会运营的文章辑录
97
97
98
98
=item L<https://www.cpan.org/>
99
99
@@ -135,7 +135,7 @@ Unicode 学术学会 (Unicode 标准的制定者)
135
135
136
136
=item L<https://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
137
137
138
- Unix/Linux 上的 UTF-8 及 Unicode 答客问
138
+ Unix/Linux 上的 UTF-8 及 Unicode 常见问题解答
139
139
140
140
=back
141
141
149
149
150
150
Audrey Tang (唐凤) E<lt>
[email protected] <gt>
151
151
152
+ Sizhe Zhao E<lt>
[email protected] <gt>
153
+
152
154
=cut
0 commit comments