那些主流編程語言的知識,C語言

前言

對於編程語言來說,經常看到有因為各自支持的語言陣營而互懟的,其實根本沒那個必要,都只是一種工具而已。當多數主流語言都會使用時也許你就不會有偏見了,本質不過都是用來描述計算機的一個任務,只是每門語言設計時考慮的側重點不一樣而已。大家最好不要停留在語言層面去爭執,不如把時間花在計算機實現原理和結構的本質上,這樣更能理解編程語言每一行描述的東西在計算機是幹什麼的。本系列將總結現在IT領域主流的那些編程語言的相關知識。


那些主流編程語言的知識,C語言


關於C語言

C語言是最經典的語言,很多其他語言的運行環境也是用C來寫的,對於寫程序的人則能不懂C語言呢!提到C首先必然會讓人關聯到指針,當年在大學讓你困惑的指針卻是C語言威力無窮的基礎。C語言可能從更高層面的設計和編寫效率上有所欠缺,但卻足夠經典且容易操控底層。指針雖然風險不小,但卻十分強大。此外ANSI C也增強了C程序在不同操作系統的遷移性,下面列一些C語言的一些基礎知識。


那些主流編程語言的知識,C語言


翻譯階段

編寫好的C程序需要先編譯成可執行的機器指令才能運行,這便是翻譯工作。翻譯的主要步驟是編譯和鏈接,編譯就是源代碼到目標代碼,而鏈接是將各個目標文件鏈接起來從而形成一個可執行的程序,當然鏈接器也會引入被程序所用到的所有標準C函數庫的函數。有時編譯過程還會將預處理作為一個階段,它主要是對源文件進行一些處理,比如將#define替換成實際值、將#include指定的文件內容填充進來。下面是使用gcc來編譯並鏈接的例子,經過編譯和鏈接後得到可執行程序,這兩個步驟通過gcc來完成,命令為gcc hello.c -o hello,最終運行./hello會輸出“hello world”。

<code>#include<stdio.h>

int main()
{
printf("hello world");
}

複製代碼/<stdio.h>/<code>


那些主流編程語言的知識,C語言


假如我們編寫了多個c文件,則編譯器會分別編譯成多個obj目標文件,然後再通過鏈接器將所有目標文件鏈接起來生成可執行文件。


那些主流編程語言的知識,C語言


關於擴展名

注意windows系統的目標文件擴展名為obj,一般鏈接完成後也不會被刪除。而unix-like系統的目標文件擴展名為o,一般在鏈接完成後會被刪除。windows系統的可執行文件擴展名為exe,而unix-like系統的可執行文件名可以任意命名。此外,C語言源文件一般後綴為c,而頭文件後綴為h,雖然沒有強制規定但大家都會去遵守這個約定。

關於編譯器

翻譯階段需要將C語言代碼變為可執行程序,這些工作由C編譯器完成。C編譯器也有很多,常見的如下:

  • GCC,GCC即(GNU Compiler Collection,GNU編譯器套件),由GNU開發的GPL許可的編譯器自由軟件。剛開始只作為C語言編譯器,但後來發展成多種語言編譯器,比如C、C++、Java、Android、Objective-C和Fortran等等。現在很多unix-like操作系統自帶GCC,將其作為標準編譯器。
  • MS C,與微軟的Visual Studio一起集成發佈,由微軟提供的一套完整的集成開發環境,編譯後能在微軟的所有操作系統上運行。比如VS一般會使用CL編譯器。
  • Clang,它是一個基於LLVM的C/C++/Objective-C輕量級編譯器,常用於Mac系統下。
  • Turbo C,這是一個比較流行的C編譯器,小巧快速。
  • cc,即C Compiler,這是一個unix系統古老的編譯器,很多經典書籍會看到這個編譯器。為保持兼容,現在的linux系統會將cc作為一個符號連接指向gcc,即/usr/bin/cc -> gcc。

gcc編譯例子

以linux系統的gcc為例,看幾個編譯例子。假如hello.c的代碼如下,

<code>#include<stdio.h>

int main()
{
printf("hello world");
}
複製代碼/<stdio.h>/<code>

我們直接使用如下的gcc命令對其進行編譯,而且不帶任何參數,此時將生成一個名為out.a的可執行文件,通過./a.out能夠輸出“hello world”。

<code>gcc hello.c
複製代碼/<code>

假如添加name.h/name.c和adder.h/adder.c兩對頭文件和源文件,而且將hello.c稍作修改,三個文件代碼分別如下。

<code>//name.h
char* get_name();

//name.c
char* get_name() {
\tchar* name = "seaboat : ";
\treturn name;
}
複製代碼/<code>
<code>//adder.h
int add(int a, int b);

//adder.c
int add(int a, int b) {
\treturn (a + b);
}
複製代碼/<code>
<code>//hello.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include"adder.h"
#include"name.h"
int main()
{
\tchar* name = get_name();
\tchar* hello = "hello world";
\tchar* output = (char*)malloc(strlen(hello) + strlen(name));
\tsprintf(output, "%s%s", name, hello);
\tprintf("%s\\n", output);
\tint a = 1;
\tint b = 3;
\tprintf("a + b = %d\\n", add(a, b));
}
複製代碼/<string.h>/<stdlib.h>/<stdio.h>/<code>

則通過如下的命令可以對多個源文件進行編譯和鏈接,最終生成一個名為a.out的可執行文件。當我們通過./a.out執行可執行文件時,它將輸出“seaboat : hello world a + b = 4”。

<code>gcc name.c adder.c hello.c
複製代碼/<code>

我們還可以通過下面兩個命令對name.c和adder.c兩個文件編譯生成目標文件,分別為adder.o和name.o。然後再通過下面第三行命令來編譯hello.c源文件,編譯完後它會自動與name.o和adder.o兩個目標文件進行連接。

<code>gcc -c adder.c
gcc -c name.c
gcc name.o adder.o hello.c
複製代碼/<code>

此外,還能夠通過下面的命令來給多個源文件進行編譯並生成各自對應的目標文件,這意味著不對它們進行鏈接。

<code>gcc -c  name.c adder.c hello.c
複製代碼/<code>

對於多個目標文件,如果要將他們鏈接可以通過下面的命令,便能夠生成可執行文件。

<code>gcc  name.o adder.o hello.o
複製代碼/<code>

如果我們想對生成的可執行文件進行命名,那麼可以通過下面第一行命令來實現,將生成一個名為hello的可執行文件。類似地,也可以對多個目標文件進行連接時指定可執行文件名,如下面第二行命令,將生成一個名為hello2的可執行文件。

<code>gcc name.c adder.c hello.c -o hello

gcc name.o adder.o hello.o -o hello2
複製代碼/<code>

關於字符集

編寫C語言時源代碼可以包括如下字符集:

  1. 英語大寫小寫字母
<code>A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
複製代碼/<code>
  1. 十進制的阿拉伯數字
<code>0 1 2 3 4 5 6 7 8 9
複製代碼/<code>
  1. 其它符號
<code>! " # % & ' () * + , - . / :
; < = > ? [ ] \\ ^ _ { } | ~
複製代碼/<code>
  1. 空白符
<code>空格、水平製表符、垂直製表符、換行、換頁
複製代碼/<code>

關於註釋

C語言提供的註釋方式有兩種:以/*開始而以*/結束來註釋多行代碼,以//開始來註釋單行代碼。一般來說對源碼中進行註釋則意味著編譯時會被預處理器清除掉,用空格來替代。

<code>/*
第一種註釋方式
*/

//第二種註釋方式

複製代碼/<code>

關於標識符與關鍵詞

標識符就是我們開發人員對變量、函數、類型、結構體、宏等等的起名,C語言也要求我們要按照它的規定來取名。按照規定,標識符可以由英文大小寫字母(A~Z, a~z)、阿拉伯數字(0~9)、和下劃線(_)組成。需要注意以下幾點:

  • 要求不能以字母開頭。
  • C語言對大小寫字母敏感。
  • C語言不會對標識符的長度進行限制,但標準允許編譯器忽略第31位以後的字符,具體截取前多少位則由不同的編譯器來實現,當截取的字符串相同時則認為是同一個標識符。
  • 標識符不應該亂取名,儘量要讓標識符名字具有相應的意義。

當然C語言還保留了32個特殊的關鍵詞,我們命名的標識符不能與它們相同,否則就會報錯。這32個關鍵詞如下:


那些主流編程語言的知識,C語言


那些主流編程語言的知識,C語言


分享到:


相關文章: