RISC-V 编译、链接、加载

mwish

2020-10-05

我们介绍了 RISC-V 的指令，你可以当作介绍了汇编语言。但是，我们现在知道的是：

RV32I 的格式都是 32bit 的
以上内容可以以 beq 等格式让读者可读，但是机器执行的还是那6种格式的代码

我们也了解了 RISC-V 的 calling convention 和 ABI, 这一节介绍程序的编译、链接、加载。基础知识可以阅读 CSAPP 第七章和 https://zhuanlan.zhihu.com/p/125163040 我之前写的垃圾。不过今天我写的会细一些。

7E604484-7BD6-4192-81E0-F5C0E8F31750

编译

编译由 .c 转为汇编语言，形式是 .s, 这个我们之前都用过了

1	✗ riscv64-unknown-elf-gcc -march=rv32imac -mabi=ilp32 -S

这样体验一把就行。Compiler 需要走：

Lexer: 语法分析，把目标转成 token. 实际上可以借用 Lex 工具，而 Flex 是 Lex 的一个实现。
Parser: 将内容变为 AST
Semantic Analysis and Optimization: 检查 AST, 然后做一些优化
Code generation: 做寄存器 allocation, 代码生成

实际上，我们生成 -S 也需要指定编译选项，能指定 -O。这里我们可以得到可靠的 RISC-V 的代码。它和我们的程序是逻辑上等价的，当然可能要进行一定的优化。

注意，在 RISC-V 中，编译是会产生便于理解的伪指令的。

汇编

将汇编语言生成 ELF 的 object file, object file 属于 machine language 了。

1AD78D8D-1536-428E-99BE-5E072623028C

ELF 文件包括：

ELF Header, 以一个 16byte 的序列开始，描述系统 word 大小、字节顺序等
.text text segment, 编译程序的机器代码
.data 已初始化的 global/static C variable, 即源代码的 static 部分。
- Local 是在 stack 中的
- 未初始化的、被初始化为 0 的，在 .bss 中。它不占据实际空间，有点类似 gcc 的 __weak__ .
.symtab ，符号表，存放定义、引用的函数、全局变量和不可被 reference 的 static 变量
.debug 调试符号表，包含原始文件; .line 同样，包含行号和 .text 的映射。只有 -g 编译才会产生
.strtab 字符串表，包含定义的 string 和 section 的名字。

ELF 具体信息可以看：

那么我们还要注意，有的 directions, 即汇编指示符，会被丢给链接器，但不产生什么代码

.text user text segment 中的片段
.data 需要写到 user data segment 中的片段
.globl sym 可以从其他文件引用的全局符号
.string str 把对应的 C-Style 字符串存在内存中
.word w1...wn 把这 n 个连续的符号连续存取

同时，在链接的时候，会完成伪指令的替换，把它们全部替换成具体的指令（这里可以表示 RV32I 这样的）。

我们来看看 hello world:

#include <stdio.h>
int main() {
	printf("Hello, %s", "world");
	return 0;
}

在 RISC-V Book 上，它生成了如下的汇编：

FD540A48-C82E-41A5-9218-F3899DE2A9DA

其中图 3.6 中用到的指示符有:

.text:进入代码段。

.align2:后续代码按22字节对齐。

.globl main:声明全局符号“main”。

.section .rodata:进入只读数据段

.balign4:数据段按4字节对齐。

.string “Hello, %s!\n”:创建空字符结尾的字符串。

.string “world”:创建空字符结尾的字符串。

tail call optimization

1 2	fn: return foo(x)

这个时候，正常行为应该是：把 a0 设置 x, 然后返回调用后的 a0, 即：

然后用 j 或者 tail 直接调用 foo(y) ，这玩意会做个保存，把本函数的 ra, sp 保存，这样跳转的话就可以直接跳转到 fn 的调用者。

在 RISC-V 伪指令中，有一条 tail, 会被解释成

1 2	auipc x6, offset[32:12] jalr x0, x6, offset[11:0]

用 tail 和 j 来完成上述的 jump，而不再调用前再去设 sp/ra

这个行为让我有些头晕，我在网上找到了这篇 blog: https://www.sifive.com/blog/all-aboard-part-3-linker-relaxation-in-riscv-toolchain

上面的链接倒是介绍的比较清楚。

生成机器代码

我们描述过 ELF 格式了，我们有下列几个问题

压缩指令

RV32C 支持压缩指令：

每条短指令长度为 16bits
必须和 32bits 指令一一对应
只对汇编器和连接器可见，并且是否以短指令取代对应的宽指令由它们决定。编译器编写者和汇编语言程序员可以幸福地忽略 RV32C 指令及其格式，他们能感知到的则是最后的程序大小小于大多数其它 ISA 的程序。

DB8DEC4A-F78C-4641-9652-266DB487A1F0

RV32C 如上

0119C713-D3D9-4C9F-B9F2-91F26E82EBCE

那么，考虑压缩指令，会有下列问题：

So the presence of the 16b instructions doesn’t need to be known to anybody but the assembler and the RISC-V processor itself!

Forward Reference

即假设 L1 --> L2, 但 L1 在 L2 之前，那么这暗示编译器需要一张局部的符号表，并扫描不止一个 pass，来完成这个操作。

jal/la static 加载

jal 会跳转一个 imm, 而 static 变量加载中，可能对应的符号来自另一个文件定义的内存中。

Tables

为了解决上述问题，有了 symbol table 和 relocation table：

symbol table 展示可能被其他文件用到的本文件符号，例如 function call 的 label, 和 .data 中可以被外部访问的符号。

Relocation Table 展示 jal 和 la 中需要重定位的地址。

链接

讲 ELF 的 objective code 转化为可执行文件，这一过程被称为 linking, 这一过程有逻辑上如下的流程：

从 .o 文件把 text segment 合在一起
拿到 data segment, 拼接到一起
resolve reference, 解决掉跨文件的符号、依赖问题，用绝对的地址填充

实际上，beq bne jal 这类 PC-relevant 的指令不会被 relocate, 而用 name/label 相关的和 static 的会 relocate.

加载

通常 OS 会加载、运行程序：

B3419A1F-3922-41B9-8134-4EC45ED97B81

它需要：

读 executable 文件，加载 ELF，来知道 text 和 data 的大小
创建带 stack、text 的地址空间
把 instruction 和 data 拷贝到新的地址空间
拷贝用户的参数，传到栈上，供程序运行
初始化寄存器
跳转到用户程序，并设置 PC

全流程

#include <stdio.h>
int main(int argc, char* argv[]) {
	int i;
	int sum = 0;
	for (i = 0; i <= 100; i++) 
		sum += i * i;
	printf("The sum of sq from 0 .. 100 is %d\n", sum);
}