编码风格之(4)GNU软件标准风格(2)

本文介绍: 例如，当函数定义的头部分发生变化时，VCS日志命令中显示的diff块的头将错误地命名为被修改的函数(通常是在被修改的函数之前定义的函数)，因此使用这些diffs来收集被修改函数的名称将产生不准确的结果。如果VCS存储库是可公开访问的，并且更改是单独提交给它的(每个逻辑更改集一次提交)，并记录每个更改的作者，那么VCS记录的信息可以用于从VCS日志中生成更改日志，并通过使用合适的VCS命令来回答上述问题。这个原则适用于每一个层次，从最低的(段落中的句子排序)到最高的(手册中的章节主题排序)。

Author：Onceday Date: 2023年2024年1月8日

漫漫长路，才刚刚开始…

本文主要翻译自《GNU编码标准》(GNU Coding Standards)一文。

参考文档:

为了在最广泛的环境中获得最大的可读性，请将源行长度保持在79个字符或以下。将开始C函数体的开括号放在第一列中是很重要的，这样它们将开始定义函数。有几个工具在第一列中查找开括号来查找C函数的开头。这些工具无法处理未以这种方式格式化的代码。

当它们在函数内部时，避免在第一列中放入左括号、左括号或左括号，这样它们就不会开始定义函数。开始结构体的开括号可以放在第一列，如果您认为将该定义视为函数定义有用的话。

static char *
concat (char *s1, char *s2)
{
...
}

static char *
concat (s1, s2) /* Name starts in column one here */
	char *s1, *s2;
{ 				/* Open brace in column one here */
...
}

int
lots_of_args (int an_integer, long a_long, short a_short,
			  double a_double, float a_float)
...

struct foo
{
int a, b;
}
or
struct foo { int a, b; }

本节的其余部分给出了关于C格式风格的其他方面的建议，这也是1.2及更新版本中indent程序的默认风格。它对应于选项

-nbad -bap -nbc -bbo -bl -bli2 -bls -ncdb -nce -cp1 -cs -di2
-ndj -nfc1 -nfca -hnl -i2 -ip5 -lp -pcs -psl -nsc -nsob

if (x < foo (y, z))
	haha = bar[4] + 5;
else
	{
		while (z)
			{
				haha += foo (z, z);
				z--;
			}
		return ++x + bar ();
	}

if (foo_this_is_long && bar > win (x, y, z)
	&& remaining_condition)

mode = (inmode[j] == VOIDmode
    || GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])
    ? outmode[j] : inmode[j]);

mode = ((inmode[j] == VOIDmode
	|| (GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])))
	? outmode[j] : inmode[j]);

v = rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
	+ rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000;

v = (rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
	+ rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000);

do
	{
		a = foo (a);
	}
while (a > 0);

请使用换行符(control-L)在逻辑位置将程序划分为页面(但不要在函数内)。这与页面的长度无关，因为它们不必适合打印页面。表单提要应该单独显示在行上。

每个程序都应该以一个简短的注释开始，说明它的用途。例如:fmt - filter for simple filling of text。该注释应该位于包含程序main函数的源文件的顶部。

请在每个函数上加注释，说明这个函数是做什么的，它得到什么类型的参数，参数的可能值意味着什么，用于什么。如果C类型以其习惯方式使用，则没有必要在文字中重复C参数声明的含义。如果它的使用有任何不标准的地方(比如char *类型的参数实际上是字符串的第二个字符的地址，而不是第一个字符的地址)，或者任何可能的值都不能按预期的方式工作(比如，包含换行符的字符串不能保证工作)，一定要这样说。同时说明返回值的意义(如果有的话)。

如果您使用参数名称来说明参数值，则对函数的注释会清晰得多。变量名本身应该是小写的，但是当你谈论值而不是变量本身时，应该用大写。因此，the inode number NODE NUM而不是an inode。

/* Nonzero means truncate lines in the display;
	zero means continue them. */
int truncate_lines;

每个#endif都应该有注释，除非是没有嵌套的短条件(只有几行)。注释应该说明结束条件句的条件，包括它的意义。#else应该有一个注释，描述后面代码的条件和意义。例如:

#ifdef foo
	...
#else /* not foo */
	...
#endif /* not foo */
#ifdef foo
	...
#endif /* foo */

但是，相反，为#ifndef这样写注释:

#ifndef foo
	...
#else /* foo */
	...
#endif /* foo */
#ifndef foo
	...
#endif /* not foo */

一些程序员喜欢使用GCC的-Wall选项，并在发出警告时更改代码。如果你想这么做，那就这么做。其他程序员不喜欢使用
-Wall，因为它对他们不想更改的有效和合法代码给出警告。如果你想这么做，那就这么做。编译器应该是你的仆人，而不是主人。

不要仅仅为了用额外的警告选项(如-Wconversion和-Wundef)来安抚静态分析工具(如lint、clang和GCC)而使程序变得丑陋。这些工具可以帮助发现bug和不清晰的代码，但是它们也会产生很多错误警报，使用不必要的强制类型转换、包装和其他复杂的操作会损害可读性。

对于一个函数内的不同值反复使用相同的局部变量(名称类似于tem)曾经是一种常见的做法。与其这样做，不如为每个不同的目的声明一个单独的局部变量，并给它起一个有意义的名字。

不要使用掩盖全局标识符的局部变量或参数。GCC的-Wshadow 选项可以检测到这个问题。

int foo,	==>   int foo,bar; //更好的写法
	bar;

当一个if-else语句嵌套在另一个if语句中时，总是用大括号括住if-else语句。因此，永远不要这样写:

if (foo)
	if (bar)
		win ();
	else
		lose ();

if (foo)
{
	if (bar)
		win ();
	else
		lose ();
}

如果你有一个If语句嵌套在else语句中，要么在一行中写else If，像这样，

if (foo)
	...
else if (bar)
	...

将它的then-part像前面的then-part一样缩进，或者像这样将嵌套的if写在大括号中:

if ((foo = (char *) malloc (sizeof *foo)) == NULL)
	fatal ("virtual memory exhausted");

foo = (char *) malloc (sizeof *foo);
if (foo == NULL)
	fatal ("virtual memory exhausted");

例如，您应该使用ignore_space_change_flag;不要使用像iCantReadThis这样的名字。

/* Ignore changes in horizontal whitespace (-b). */
int ignore_space_change_flag;

当要定义具有常量整数值的名称时，请使用enum而不是#define定义。GDB知道枚举常量。

如果将文件加载到缩短文件名的MS-DOS文件系统上，您可能希望确保没有文件名会发生冲突。您可以使用doschk程序进行测试。

一些GNU程序被设计为限制文件名为14个字符或更少，以避免在将它们读入旧的System V系统时发生文件名冲突。请在已有的GNU程序中保留这个特性，但是没有必要在新的GNU程序中这样做。Doschk还报告了文件名长度超过14个字符。

在编译C文件时定义“特性测试宏”_GNU_SOURCE是个好主意。当您在GNU或GNU/Linux上进行编译时，这将启用GNU库扩展函数的声明，并且如果您在程序中以其他方式定义相同的函数名称，通常会给您一个编译器错误消息。(如果您希望使程序更易于移植到其他系统，则不必实际使用这些函数。)

printf ("size = %lun", (unsigned long) sizeof array);
printf ("diff = %ldn", (long) (pointer2 - pointer1));

像off_t这样的预定义文件大小类型是一个例外:它们在许多平台上都比long长，所以像上面这样的代码不能处理它们。可移植地打印off_t值的一种方法是自己一个一个地打印它的数字。

int c;
...
while ((c = getchar ()) != EOF)
	write (file_descriptor, &c, 1);

相反，使用unsigned char，如下所示(unsigned是为了可移植到不寻常的系统中，其中char是有符号的，并且有整数溢出检查)。

int c;
while ((c = getchar ()) != EOF)
	{
		unsigned char u = c;
		write (file_descriptor, &u, 1);
	}

printf (gettext ("Processing file ’%s’..."), file);

这允许GNU gettext用翻译后的版本替换字符串"Processing file ’%s’..."。

通常，文本域名应该与包的名称相同，例如，GNU核心实用程序的coreutils。

printf ("%s is full", capacity > 5000000 ? "disk" : "floppy disk");

printf (gettext ("%s is full"),
	capacity > 5000000 ? gettext ("disk") : gettext ("floppy disk"));

翻译人员几乎不知道disk和floppy disk是要在另一个字符串中替换的。更糟糕的是，在某些语言(如法语)中，这种结构不起作用:单词“full”的翻译取决于句子第一部分的性别，disk和floppy disk的意思不一样。

printf (capacity > 5000000 ? gettext ("disk is full")
	: gettext ("floppy disk is full"));

printf ("# Implicit rule search has%s been done.n",
	f->tried_implicit ? "" : " not");

printf (f->tried_implicit
	? "# Implicit rule search has been done.n",
	: "# Implicit rule search has not been done.n");

printf ("%d file%s processed", nfiles, nfiles != 1 ? "s" : "");

这个例子的问题是，它假设复数是通过加s构成的。如果像这样对格式字符串应用gettext，

printf (gettext ("%d file%s processed"), nfiles, nfiles != 1 ? "s" : "");

printf ((nfiles != 1 ? gettext ("%d files processed")
	: gettext ("%d file processed")),
	nfiles);

但这仍然不适用于像波兰语这样的语言，它有三种复数形式: 一种是nfiles == 1，另一种是nfiles == 2,3,4,22,23,24，…，剩还有一种表示剩下的元素。GNU的ngettext函数解决了这个问题:

printf (ngettext ("%d files processed", "%d file processed", nfiles),
	nfiles);

在GNU源代码注释、文本文档和其他上下文中，首选使用ASCII字符集(纯文本、7位字符)，除非由于应用程序领域的原因有很好的理由做其他事情。例如，如果源代码处理法国大革命日历，那么如果其文本字符串在月份名称中包含重音字符(如Flor´eal)是可以的。同样，在更改日志中使用非ascii字符来表示贡献者的专有名称也是可以的(但不是必需的)。

虽然GNU程序传统上使用0x60(``)作为开引号，0x27(' ')作为闭引号，但现在引号`like this’通常是不对称的，所以引用’ ‘like this’ ‘或’like this’通常看起来更好。

printf (gettext ("Processing file '%s'..."), file);

在这里，法语翻译可能会导致gettext返回字符串"Traitement de fichier < %s > ..."，产生更适合法语区域设置的引号。

有时程序可能需要直接使用开、闭引号。按照惯例，gettext将字符串""``""转换为开始引号，将字符串"'"转换为结束引号，程序可以使用这些翻译。但是，一般来说，最好在较长的字符串上下文中翻译引号字符。

如果您的程序的输出可能会被另一个程序解析，那么最好提供一个使解析可靠的选项。例如，您可以使用C语言或Bourne shell中的约定转义特殊字符。例如，请参阅GNU ls的选项，引用样式(--quoting-style)。

请参阅Texinfo手册，无论是硬拷贝还是通过info或Emacs info子系统(C-h – i)提供的在线版本。

“The function foo returns a list containing a and b”

A list containing a and b will be returned.

Info阅读器的--usage功能查找这样的节点或菜单项以查找相关文本，因此每个Texinfo文件都必须有一个。

对于所有超过几页的GNU手册，请使用GNU自由文档许可证。同样地，对于一组简短的文档，您只需要一份GNU FDL副本就可以完成整个集合。对于一个简短的文档，您可以使用非常宽松的non-copyleft许可证，以避免使用长许可证占用空间。

如果您决定不维护单独的变更日志文件，您仍然应该考虑在发布tarball中提供它们，以方便那些希望在不访问项目VCS存储库的情况下查看变更日志的用户。存在可以从VCS日志生成ChangeLog文件的脚本，例如，gitlog-to-changelog脚本，它是Gnulib的一部分，可以为Git存储库做到这一点。

在Emacs中，C-x v a (vc-updatechange-log)命令用于从VCS日志中增量更新ChangeLog文件。如果维护单独的更改日志文件，它们通常被称为ChangeLog，并且每个这样的文件覆盖整个目录。每个目录都可以有自己的更改日志文件，或者一个目录可以使用其父目录的更改日志，这取决于您。

用标题行开始更改日志条目是一个好主意:单行是一个完整的句子，它总结了更改集。如果您将更改日志保存在VCS中，这应该是一个要求，因为VCS命令以缩写形式显示更改日志，例如git log ——online，对标题行进行特殊处理。(在ChangeLog文件中，头行后面的一行说明了谁是更改的作者以及何时安装的。)

(1) 如果更改日志条目没有列出修改的函数/宏，那么从VCS日志生成有用的ChangeLog文件将变得更加困难，因为VCS命令不能仅从提交信息可靠地复制它们的名称。例如，当函数定义的头部分发生变化时，VCS日志命令中显示的diff块的头将错误地命名为被修改的函数(通常是在被修改的函数之前定义的函数)，因此使用这些diffs来收集被修改函数的名称将产生不准确的结果。您将需要使用专门的脚本，如下面提到的gnulib的vcs-to-changelog.py，来解决这些困难，并确保它支持项目使用的源语言。

(2) 虽然现代VCS命令，如Git的Git log -L和Git log -G，提供了强大的方法来查找影响某个函数、宏或数据结构的更改(因此，如果您有可用的存储库，可能会使ChangeLog文件变得不必要)，但它们有时会失败。例如，git log -L不支持开箱即用的某些编程语言的语法。明确地提及修改过的函数/宏，可以简单而可靠地找到相关的更改。

还可以通过运行脚本生成命名已修改实体的列表。其中一个脚本是mklog.py(用Python 3编写)，它被GCC项目使用。

Gnulib提供了这种脚本的另一个变体，称为vcs-to-changelog.py，它是vcs-tochangelog模块的一部分。请注意，这些脚本目前支持的编程语言比Emacs提供的手动命令要少。

因此，上面提到的从VCS提交历史生成ChangeLog文件的方法，例如通过gitlog-to-ChangeLog脚本，通常会产生更好的结果，前提是贡献者坚持提供良好的提交消息。

2019-08-29 Noam Postavsky <npostavs@gmail.com>

Handle completely undecoded input in term (Bug#29918)

* lisp/term.el (term-emulate-terminal): Avoid errors if the whole
decoded string is eight-bit characters. Don’t attempt to save the
string for next iteration in that case.
* test/lisp/term-tests.el (term-decode-partial)
(term-undecodable-input): New tests.

2019-06-15 Paul Eggert <eggert@cs.ucla.edu>

Port to platforms where tputs is in libtinfow

* configure.ac (tputs_library): Also try tinfow, ncursesw (Bug#33977).

2019-02-08 Eli Zaretskii <eliz@gnu.org>

Improve documentation of ’date-to-time’ and ’parse-time-string’

* doc/lispref/os.texi (Time Parsing): Document
’parse-time-string’, and refer to it for the description of
the argument of ’date-to-time’.

* lisp/calendar/time-date.el (date-to-time): Refer in the doc
string to ’parse-time-string’ for more information about the
format of the DATE argument. (Bug#34303)

例如，有些人倾向于通过以下方式来缩写函数名称组* register.el ({insert,jump-to}-register)，这不是一个好主意，因为搜索跳转到寄存器或插入寄存器将找不到该条目。

* src/keyboard.c (menu_bar_items, tool_bar_items)
(Fexecute_extended_command): Deal with ’keymap’ property.

向ChangeLog添加条目的最简单方法是使用Emacs命令M-x addchange-log-entry，或其变体c - x4a (add-change-log-entry-other-window)。这将自动收集已更改的文件和已更改的函数或变量的名称，并根据上述约定格式化更改日志条目，由您来描述对该函数或变量所做的更改。

2002-07-14 John Doe <jdoe@gnu.org>
	* sewing.c: Make it sew.

2002-07-14 Usual Maintainer <usual@gnu.org>
	* sewing.c: Make it sew. Patch by jdoe@gnu.org.

当将其他人的更改提交到VCS中时，使用VCS的特性来指定作者。例如，使用Git，使用Git commit ——author=author。

至于日期，应该是您应用更改的日期。(对于VCS，使用适当的命令行开关，例如，git commit ——date=date)

现代VCS有命令来应用通过电子邮件发送的更改(例如，Git有Git am);在这种情况下，将自动从电子邮件消息中收集变更集的作者及其生成日期，并记录在存储库中。

如果补丁是用合适的VCS命令准备的，比如git format-patch，电子邮件消息体也会有更改集的原作者，所以重新发送或转发消息不会干扰将更改归给其作者。因此，我们建议您请求您的贡献者使用git format-patch等命令来准备补丁。

2019-08-29 Eli Zaretskii <eliz@gnu.org>

* lisp/simple.el (kill-do-not-save-duplicates): Doc fix. (Bug#36827)

* keyboard.c (Fcommand_execute): New arg SPECIAL.
All callers changed.

2019-01-07 Paul Eggert <eggert@cs.ucla.edu>

Update copyright year to 2019

Run ’TZ=UTC0 admin/update-copyright $(git ls-files)’.

源文件通常可以包含以构建时条件或静态条件为条件的代码。例如，C程序可以包含编译时的#if条件，用解释型语言实现的程序可以包含函数定义的模块导入，这些函数定义只对特定版本的解释器执行，和Automake Makefile.Am文件可以包含变量定义或目标声明，只有在配置时Automake条件为真。

* xterm.c [SOLARIS2]: Include <string.h>.
* FilePath.pm [$^O eq ’VMS’]: Import the VMS::Feature module.
* framework.py [sys.version_info < (2, 6)]: Make "with" statement
	available by importing it from __future__,
	to support also python 2.5.

接下来，有一个条目描述了一个完全有条件的新定义: C语言宏FRAME_WINDOW_P只有在宏HAVE_X_WINDOWS被定义时才会被定义(和使用):

* frame.h [HAVE_X_WINDOWS] (FRAME_WINDOW_P): Macro defined.

接下来是init_display函数中的一个更改条目，它的定义作为一个整体是无条件的，但是更改本身包含在#ifdef中HAVE_LIBNCURSES的条件:

* dispnew.c (init_display) [HAVE_LIBNCURSES]: If X, call tgetent.

* host.c (gethostname) [!HAVE_SOCKETS]: Replace with winsock version.

用尖括号标明函数中发生变化的部分，并注明变化部分的作用。下面是sh-while-getopts函数中处理sh命令部分的修改:

* progmodes/sh-script.el (sh-while-getopts) <sh>: Handle case that
user-specified option string is empty.

最后，GNU help2man程序是自动生成手册页的一种方法，在本例中是通过--help输出生成手册页。这在许多情况下是足够的。

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

GNU软件编码标准风格(2)

文章目录

5. 充分利用C

5.1 格式化源代码

5.2 注释代码

5.3 干净地使用C结构

5.4 命名变量、函数和文件

5.5 系统类型之间的可移植性

5.6 cpu之间的可移植性

5.7 调用系统功能

5.8 国际化

5.9 字符集

5.10 引用字符

5.11 Mmap文件映射

6. 记录项目文档

6.1 GNU参考手册

6.2 文档字符串和手册

6.3 手册结构详细说明

6.4 手册License

6.5 手册名誉归属

6.6 印刷手册

6.7 新闻文件

6.8 变更日志

6.9 更改日志的概念和约定

6.10 简易更改信息

6.11 条件修改信息

6.12 部分修改信息

6.13 帮助页

6.14 阅读其他手册

发表回复取消回复