2.8 KiB
支线任务: 中文 BBS GBK 转 UTF8
我过年这两天在服务器运维群看到了 水木清华BBS 这个东西, 于是就 telnet 试了下, 发现字符集是 GBK! emmm, 设置环境变量启动终端不行, 就得在 gnome-terminal 设置里面弄.
进去看了, 发现好多神奇的东西, 但整体还是没落, 现在还是虎年的欢迎页面… 结合我之前在 sdf.org, 新黑客词典, youtube 等地方看到的关于 BBS 的记忆片段, 使我开始考古这个从曾经那个时代来的我从没接触过的东西.
先解决客户端问题: 我在 Back To BBS 节目里面看到了 Syncterm 和 Netrunner, 一个不支持中文, 一个根本无法启动 (cannot open display). 然后我找到了 qterm, 先是在水木 FreeBSD 版块看见的, 后来搜索 BBS 客户端时想起来了. 下下来试一下, 不错. 但是我不想为了这一个东西而装一个额外软件, 还得编译.
然后就想, 如果不能终端解码, 那为啥不先转换成 UTF8 再显示呢? 那就 iconv? 结果人家是全输入完 EOF 了才显示… 有没有方式能不缓冲而是 on-the-fly 呢? 搜索引擎没搜到.
那就自己写! iconv 是基于 libiconv 库, 看看文档就能写了, 虽然我基本没写过 C 代码. 为什么不用 Rust? 因为我弄这个主要还是想弄到 OpenBSD 上, Rust 要一些依赖, 而 C 直接就能用.
#include <stdio.h>
#include <iconv.h>
#define UTF8_SIZE 4
int
convert_one(iconv_t cd)
{
char inbuf[2] = {0};
char outbuf[UTF8_SIZE] = {0};
size_t insize = 1;
size_t outsize = UTF8_SIZE;
char c = getchar();
if (c == EOF)
return 1;
inbuf[0] = c;
char * pIn = inbuf;
char * pOut = (char*) outbuf;
size_t iconv_result = iconv(cd, &pIn, &insize, &pOut, &outsize);
if (iconv_result == (size_t) -1) {
inbuf[1] = getchar();
insize = 2;
iconv(cd, &pIn, &insize, &pOut, &outsize);
}
for (int i = 0; i < UTF8_SIZE; i++) {
if (outbuf[i] != 0)
putchar(outbuf[i]);
fflush(stdout);
}
return 0;
}
int
main(void)
{
iconv_t cd = iconv_open("UTF8", "GBK");
while (1)
if (convert_one(cd) == 1) break;
iconv_close(cd);
return 0;
}
好使, 但是, 我写这篇文章的时候又过去看了眼那个帖子的回复, 发现有这个:
luit -encoding gbk <command>
嗯, 好使… 另一个帖子说 GNU screen 也可以, 然后搜索 screen 转码的时候看到了这个 GNU screen encoding的替代品,自制BBS转码脚本
但自己造轮子还是很开心哈哈