- Linux程序设计(第4版)
- (英)Neil Matthew Richard Stones
- 3048字
- 2021-04-09 20:04:47
4.1 程序参数
当一个用C语言编写的Linux或UNIX程序运行时,它是从main函数开始的。对这些程序而言,main函数的声明如下所示:
其中argc是程序参数的个数,argv是一个代表参数自身的字符串数组。
你可能也会看到Linux的C程序将main函数简单的声明为:
这样也行,因为默认的返回值类型是int,而且函数中不用的形式参数不需要声明。argc和argv仍在,但如果不声明它们,你就不能使用它们。
无论操作系统何时启动一个新程序,参数argc和argv都被设置并传递给main。这些参数通常由另一个程序提供,这个程序一般是shell,它要求操作系统启动该新程序。shell接受用户输入的命令行,将命令行分解成单词,然后把这些单词放入argv数组。请记住:Linux的shell一般会在设置argc和argv之前对文件名参数进行通配符扩展,而MS-DOS的shell则期望程序接受带通配符的参数,并执行它们自己的通配符扩展。
例如,如果我们给shell输入如下命令:
程序myprog将从main函数开始,main带的参数是:
注意,参数个数包括程序名自身,argv数组也包含程序名并将它作为第一个元素argv[0]。因为我们在shell命令里使用了引号,所以第四个参数是一个包含了空格的字符串。
如果你用ISO/ANSI C语言编写过程序,就会对上面的这些很熟悉。main的参数对应shell脚本里的位置参数$0、$1等。ISO/ANSI C只规定main必须返回int,而X/Open规范则早已给出了如上所示的明确声明。
命令行参数在向程序传递信息方面是很有用的。例如,我们可以在一个数据库应用程序中使用命令行参数来传递想用的数据库的名字,这样就可以在多个数据库上使用同一个程序。许多工具程序也使用命令行参数来改变程序的行为或设置选项。通常,你可以使用一个以短横线(-)开头的命令行参数来设置这些所谓的标志(flag)或开关(switch)。例如,sort程序可以用一个开关来进行逆向排序(与正常排序相反):
命令行选项很常用,因此按相同的方式使用它们对程序的使用者来说是很有好处的。过去,每个工具程序采用它们各自的方式来使用命令行选项,这带来了一些混乱。例如,请看下面这些命令使用参数的方式:
我们建议在应用程序中,所有的命令行开关都应以一个短横线开头,其后包含单个字母或数字。如果需要,不带后续参数的选项可以在一个短横线后归并到一起。所以,上面的两个ls命令示例就遵循了以上准则。如果某个选项需要值,则该值应作为独立的参数紧跟在该选项后。dd命令示例违背了这一准则,因为它使用了多字符的选项,而且选项未以短横线开头(if=/dev/fd0),而tar命令则把选项和它们的值完全分开!我们建议最好能为单字符开关增加一个更长的、更有意义的开关名,这样你就可以使用-h或--help选项来获得帮助了。
有些程序还有一个奇怪的地方,就是用选项+x(举例来说)执行与-x相反的功能。例如,在第2章中,我们使用命令set-o xtrace来设置shell执行跟踪,使用命令set+o xtrace来关闭它。
撇开风格各异的语法格式不谈,单是记住所有这些程序选项的顺序和含义就已经非常困难了。通常,你只有求助于-h(帮助)选项或man手册页(如果程序员提供了的话)。你将在本章稍后看到,getopt提供了对这些问题的一个优雅的解决方案。不过现在,我们还是先看看传递到程序中的参数是怎样处理的。
实验 程序参数
下面这个程序args.c对其参数进行检查:
当运行这个程序时,它只是打印其参数和发现的选项。我们的意图是,让该程序接受一个字符串参数和一个由-f选项引入的可选的文件名参数。其他的选项也可以被定义。
实验解析
这个程序利用计数参数argc建立一个循环来检查所有的程序参数。它通过检查首字母是否是短横线来发现选项。
在本例中,如果打算支持-l选项和-r选项,那么我们就忽略了一个事实:-lr选项应该和-l -r一样处理。
X/Open规范(可以在http://opengroup.org/上找到)定义了命令行选项的标准用法(工具语法指南),同时定义了在C语言程序中提供命令行开关的标准编程接口:getopt函数。
4.1.1 getopt
为了帮助我们遵循这些准则,Linux提供了getopt函数,它支持需要关联值和不需要关联值的选项,而且简单易用。
getopt函数将传递给程序的main函数的argc和argv作为参数,同时接受一个选项指定符字符串optstring,该字符串告诉getopt哪些选项可用,以及它们是否有关联值。optstring只是一个字符列表,每个字符代表一个单字符选项。如果一个字符后面紧跟一个冒号(:),则表明该选项有一个关联值作为下一个参数。bash中的getopts命令执行类似的功能。
例如,我们可以用下面的调用来处理上面的例子:
它允许几个简单的选项:-i、-l、-r和-f,其中-f选项后要紧跟一个文件名参数。使用相同的参数,但以不同的顺序来调用命令将改变程序的行为。你可以在本章的下一个实验部分进行尝试。
getopt的返回值是argv数组中的下一个选项字符(如果有的话)。循环调用getopt就可以依次得到每个选项。getopt有如下行为。
❑ 如果选项有一个关联值,则外部变量optarg指向这个值。
❑ 如果选项处理完毕,getopt返回-1,特殊参数--将使getopt停止扫描选项。
❑ 如果遇到一个无法识别的选项,getopt返回一个问号(? ),并把它保存到外部变量optopt中。
❑ 如果一个选项要求有一个关联值(例如例子中的-f),但用户并未提供这个值,getopt通常将返回一个问号(? )。如果我们将选项字符串的第一个字符设置为冒号(:),那么getopt将在用户未提供值的情况下返回冒号(:)而不是问号(? )。
外部变量optind被设置为下一个待处理参数的索引。getopt利用它来记录自己的进度。程序很少需要对这个变量进行设置。当所有选项参数都处理完毕后,optind将指向argv数组尾部可以找到其余参数的位置。
有些版本的getopt会在第一个非选项参数处停下来,返回-1并设置optind的值。而其他一些版本,如Linux提供的版本,能够处理出现在程序参数中任意位置的选项。注意,在这种情况下,getopt实际上重写了argv数组,把所有非选项参数都集中在一起,从argv[optind]位置开始。对GNU版本的getopt而言,这一行为是由环境变量POSIXLY_CORRECT控制的,如果它被设置,getopt就会在第一个非选项参数处停下来。此外,还有些getopt版本会在遇到未知选项时打印出错信息。注意,根据POSIX规范的规定,如果opterr变量是非零值,getopt就会向stderr打印一条出错信息。
实验getopt函数
在这个实验中,你将在程序中使用getopt函数,并将新程序命名为argopt.c:
现在,当运行这个程序时,你将发现所有命令行参数都被自动处理了:
实验解析
这个程序循环调用getopt对选项参数进行处理,直到处理完毕,此时getopt返回-1。每个选项(包括未知选项和缺少关联值的选项)都有相应的处理动作。根据使用的getopt版本,你看到的输出可能和上面显示的略有不同,尤其是出错信息部分,但含义都是明确的。
当所有选项都处理完毕后,程序像以前一样把其余参数都打印出来,但这次是从optind位置开始。
4.1.2 getopt_long
许多Linux应用程序也接受比我们在前面例子中所用的单字符选项含义更明确的参数。GNU C函数库包含getopt的另一个版本,称作getopt_long,它接受以双划线(--)开始的长参数。
实验getopt_long
你可以使用getopt_long创建一个新版本的示例程序,它可以使用与前面选项等效的长参数选项:
事实上,新的长选项和原来的单字符选项可以混合使用。只要它们能够被区分开,长选项也可以缩写。有关联值的长选项可以按照格式--option=value作为单个参数给出,如下所示:
新程序longopt.c如下所示,其中,以阴影显示的部分为支持长选项而对argopt.c所做的修改:
实验解析
getopt_long函数比getopt多两个参数。第一个附加参数是一个结构数组,它描述了每个长选项并告诉getopt_long如何处理它们。第二个附加参数是一个变量指针,它可以作为optind的长选项版本使用。对于每个识别的长选项,它在长选项数组中的索引就写入该变量。在本例中,你不需要这一信息,因此第二个附加参数是NULL。
长选项数组由一些类型为struct option的结构组成,每个结构描述了一个长选项的行为。该数组必须以一个包含全0的结构结尾。
长选项结构在头文件getopt.h中定义,并且该头文件必须与常量_GNU_SOURCE一同包含进来,该常量启用getopt_long功能。
该结构的成员如表4-1所示。
表4-1
要了解GNU对getopt扩展的其他选项及相关函数,请参考getopt的手册页。