ZZC - 我的博客

约 5,881 字32 min read2026-03-27

Lec6: Activation Records

从语义合法的 typed AST 走向运行时:函数调用如何在栈上铺开、frame 与 register 如何分配、嵌套作用域与变量访问的实现。

Chapter 5 解决了"AST 是否语义合法"——我们现在有了 typed AST + symbol tables。Chapter 6 紧接着回答:

> 函数调用在机器上到底是怎么跑起来的?局部变量、参数、返回地址都放在哪?

答案是 Activation Record(活动记录),也叫 Stack Frame(栈帧)——它是编译器前端与机器层面真正接轨的第一个概念。

/blog/Coure-Notebook/Compiler_Principle/Lec6

约 2,637 字16 min read2026-03-20

Lec2: Lexical Analysis

编译原理课程的第二章，介绍了词法分析的基本概念、正则表达式以及有限自动机。词法分析器将源代码转换为 token 流，使用正则表达式描述 token 模式，并通过 NFA 和 DFA 实现。课程还介绍了 Lex 工具，用于自动生成词法分析器，以及 DFA 最小化算法，优化状态数量。

编译器分为前端和后端：

前端（Analysis）

Lexical Analysis: breaking the input into individual words or "tokens";

/blog/Coure-Notebook/Compiler_Principle/Lec2

约 421 字3 min read2026-03-13

Lec1: Introduction

编译原理课程的第一章，介绍了编译器的基本概念、模块化设计以及常用工具。编译器是将一种语言转换为另一种语言的程序，分为多个阶段，每个阶段处理不同的抽象表示形式。课程还介绍了正则表达式和上下文无关文法，以及相应的工具Lex和Yacc，用于词法分析和语法分析。

什么是编译器：编译器实际上就是一个可以将一个语言（source language）转化成另一个语言（target language）的程序（equivalent program）。

两个重要概念：

Phases：one or more modules operating on the different abstract “languages” during compiling process

/blog/Coure-Notebook/Compiler_Principle/Lec1

约 145 字1 min read2026-03-06

课程介绍与评分

编译原理课程的第一堂课，介绍了课程的分数构成、习题课安排以及实验目标。学生需要编写一个编译器，将源语言SysY编译成RISC-V 32汇编语言。实验报告需要详细描述实验思路，并且需要独立完成，禁止使用AI工具。

HW：10分 10次

Quiz 10分理论课上测试

Lab 30分五个实验

/blog/Coure-Notebook/Compiler_Principle

日语学习点击跳转

Lec3: 浊音和长音

在五十音基础上扩展:浊音、半浊音、拗音以及长音的发音规则与书写标记。

约 205 字1 min read2026-02-13

浊音实际上就是对50音中的某几行的声调进行了变化，同时在平假名/片假名的右上方使用特殊符号进行标识。

这是一种特殊的变化，也就是半浊音。

如上图所示，前四个都是长音，最后一个则不是。

/blog/Language/JP_learning/Lec3-Dakuon-and-Choon

约 2,082 字10 min read2026-02-12

Lec5: Monte Carlo Learning

从 Model-based 走向 Model-free:用蒙特卡洛采样估计动作价值,介绍 MC Basic、Exploring Starts 与 ε-Greedy 等同策略 MC 方法。

Model 通常指“环境的运行规律”，也就是我们前面经常提到的状态转移概率 $P(s' \mid s,a)$ 以及奖励函数 $R(s,a)$。

强化学习有两种，Model-based 和 Model-free。前者先构建出 $P$ 和 $R$，再进行学习；后者则是在真实环境中不断试错。大多数经典的深度强化学习的算法，比如 Q-Learning、DQN、DDPG、PPO 等，全都是 Model-free 的。

举个例子，假如我们投掷硬币，结果记为随机变量 $X$。当硬币面朝上时，$X=+1$；当硬币面朝下时，$X=-1$。我们的目标是要计算 $\mathbb{E}[X]$。

/blog/Coure-Notebook/Reinforcement_learning/Lec5-Monte-Carlo

日语学习点击跳转

Lec2: 日语声调

日语高低声调的标记体系、平板型与起伏型的辨识方法,以及常见词汇的声调分类示例。

约 103 字1 min read2026-02-06

对于书上来说，只标注高音，不标注低音。

第一个音和第二个音不是同音

出现降音就不会再升回去

/blog/Language/JP_learning/Lec2-Pitch-Accent

约 1,435 字7 min read2026-02-05

Lec4: Value Iteration & Policy Iteration

求解 Bellman 最优方程的两条经典路径:Value Iteration 直接迭代 Bellman 算子,Policy Iteration 在策略评估与改进之间交替,并讨论二者的等价性与收敛性。

这一节的数学基础其实就是上节课介绍过的公式：

v_{k+1}=f(v_k)=\max_\pi(r_\pi+\gamma P_\pi v_k)

/blog/Coure-Notebook/Reinforcement_learning/Lec4-Value-and-Policy-Iteration

日语学习点击跳转

Lec1: 五十音

日语入门第一步:五十音图的元音与辅音结构、平假名与片假名的写法及常用记忆方法。

约 951 字5 min read2026-01-30

重点是第一行的“aiueo”以及第一列的“akstnhmyrw”

第一列记忆口诀：我开桑塔纳，蛤蟆也来玩

假名来源：汉字“安”

/blog/Language/JP_learning/Lec1-Gojuon

约 1,710 字8 min read2026-01-29

Lec3: Bellman Optimality Equation

Bellman 最优方程及其压缩映射性质,Banach 不动点定理保证收敛唯一解,以及最优策略的存在性。

我们以一个例子作为引入：

于是显然有：

/blog/Coure-Notebook/Reinforcement_learning/Lec3-Bellman-Optimality

约 1,825 字8 min read2026-01-22

Lec2: Bellman Equation

从回报的递推性出发推导 Bellman 方程:状态价值函数的定义、矩阵形式的封闭解,以及策略评估在 MDP 上的意义。

在上一节中我们介绍过了 return，return 之所以很重要，是因为 return 可以帮助我们直观地确定哪一种策略更好。

对于上面的例子，我们可以计算出各个 return 如下：

/blog/Coure-Notebook/Reinforcement_learning/Lec2-Bellman-Equation

约 2,033 字10 min read2026-01-15

Lec1: Basic Concepts in Reinforcement Learning

以方格世界为例,构建强化学习的基础数学框架:状态、动作、奖励、状态转移、策略、轨迹与回报,以及引入折扣率后的折扣回报,最终统一为马尔可夫决策过程(MDP)。

> 摘要:本讲义以方格世界(Grid-world)为例,系统构建了强化学习的基础数学框架。首先定义了智能体与环境交互的核心要素,包括描述环境状况的状态(State)空间、依赖于当前状态的动作(Action)空间,以及作为人机接口用于引导行为的标量奖励(Reward)。在此基础上,讲义阐述了概率性的状态转移(State transition)机制和智能体选择动作的策略(Policy),并引入轨迹(Trajectory)与回报(Return)来评估策略优劣。为了解决无限视界下的发散问题,进一步提出了引入折扣率 $\gamma$ 的折扣回报(Discount return)概念。最终,这些要素被统一形式化为马尔可夫决策过程(MDP),其核心特征在于具备无记忆性(Memoryless)的马尔可夫性质,即未来的演变仅取决于当前的状态与动作。

假设我们有一个机器人在方格中行走，要从 start 到 target。如下图所示：

其中，方块有三种类型：Accessible/forbidden/target，同时还有一个边界 boundary。

/blog/Coure-Notebook/Reinforcement_learning/Lec1-Basic-Concepts

约 44 字1 min read2026-01-06

Lec12: Mass-Storage System

磁盘结构与调度算法(FCFS/SSTF/SCAN/C-SCAN)、磁盘管理、RAID 与 SSD,以及现代存储接口。

[咸鱼](https://xuan-insr.github.io/%E6%A0%B8%E5%BF%83%E7%9F%A5%E8%AF%86/os/V_storage_management/11_mass_storage/)

[NoughtQ](https://note.noughtq.top/sys/os/11)

感觉现在还是NoughtQ的更适合

/blog/Coure-Notebook/Operating_System/Lec12

约 3,031 字16 min read2025-12-30

Lec11: File System Implementation

文件系统分层结构、磁盘上的元数据组织、目录实现、空闲空间管理、分配方法,以及效率与性能。

I/O control：

翻译高级命令为底层指令

Basic File System：

/blog/Coure-Notebook/Operating_System/Lec11

约 2,922 字15 min read2025-12-20

Lec10: File-System Interface

文件与目录的概念、访问方式、共享与保护、文件系统挂载,以及目录结构(单层/两层/树形/无环图/通用图)。

感觉这一章不需要花费太多的时间，就看看别人的笔记吧：[xyx的笔记](https://xuan-insr.github.io/%E6%A0%B8%E5%BF%83%E7%9F%A5%E8%AF%86/os/VI_file_system/13_fs_interface/)

文件系统的定义如下所示：

The way that controls how data is stored and retrieved in a storage medium.

/blog/Coure-Notebook/Operating_System/Lec10

约 3,077 字16 min read2025-12-10

Lec9: Virtual Memory

请求调页、页面置换算法(FIFO/Optimal/LRU/Clock)、帧分配策略、抖动与工作集模型。

这一章与上一章有什么区别呢？我的理解如下：

上一张强调的是 virtual address 和 physical address 的映射关系，是在内存分配好了的情况下进行的。

这一章我们的任务是在程序刚开始的时候，我们怎么将程序加载进内存中去。

/blog/Coure-Notebook/Operating_System/Lec9

约 4,637 字24 min read2025-11-30

Lec8: Main Memory

内存管理基础、地址绑定、连续内存分配与分段、分页机制、TLB、共享与保护。

Program must be brought (from disk) into memory and placed within a process for it to be run

Main memory and registers are only storage CPU can access directly

/blog/Coure-Notebook/Operating_System/Lec8

约 2,972 字16 min read2025-11-20

Lec7: Deadlocks

死锁的四个必要条件、资源分配图、死锁预防/避免(银行家算法)、检测与恢复。

A set of blocked processes each holding a resource and waiting to acquire a resource held by another process in the set.

Example

System has 2 disk drives.

/blog/Coure-Notebook/Operating_System/Lec7

约 4,112 字22 min read2025-11-10

Lec6: 进程同步

临界区问题、Peterson 解、硬件原子指令、互斥锁、信号量、管程,以及经典同步问题(生产者-消费者/读者-写者/哲学家就餐)。

引入临界区问题，它的解决方案可以用于确保共享数据的一致性。

讨论临界区问题的软件与硬件解决方案。

分析进程同步的多个经典问题。

/blog/Coure-Notebook/Operating_System/Lec6

约 1,902 字10 min read2025-10-30

Lec5: CPU Scheduling

CPU 调度的基本概念、各类调度算法(FCFS/SJF/RR/优先级/多级反馈队列),以及多核与实时调度。

CPU Scheduling 不仅适用于进程调度，也适用于线程的调度。

在系统调用完成并返回用户态时能够进行 CPU 调度。

Maximum CPU utilization obtained with multiprogramming

/blog/Coure-Notebook/Operating_System/Lec5

约 2,114 字11 min read2025-10-20

Lec4: Threads（多线程编程）

为什么需要线程、多线程模型、Pthreads/Java/OpenMP 等线程库,以及隐式线程与线程相关问题。

首先来看几段代码：

代码1:

main(){

/blog/Coure-Notebook/Operating_System/Lec4

约 4,381 字23 min read2025-10-09

Lec3: Processes

进程的概念、PCB 结构、进程状态转换、进程调度,以及进程间通信(IPC)。

在本课程中，我们认为 job 一词和 process 是等价的*

进程运行需要一点东西：

Code/Text section：程序代码，code

/blog/Coure-Notebook/Operating_System/Lec3

约 1,593 字9 min read2025-09-28

Lec2: Operating-System Structures

操作系统能提供哪些服务、系统调用与 shell 接口、内核结构(单体/分层/微内核/模块化)。

以下图片展示了操作系统所能提供的服务：

对于用户来说，操作系统可以提供一系列的服务：

User Interface：基本上所有的操作系统都有用户界面。

/blog/Coure-Notebook/Operating_System/Lec2

约 2,346 字12 min read2025-09-25

Lec1: Introduction

操作系统第一章:操作系统是什么、它管理哪些资源、为什么需要它,以及本课程关注的三大 Management(进程/内存/存储)。

本课程原理的部分就是三个 Management

操作系统就是一个运行在电脑用户以及电脑硬件之间的程序，这个程序我们也称为kernal

操作系统的目标：

/blog/Coure-Notebook/Operating_System/Lec1