CS144 Lab0实战记录:搭建网络编程基础

发布于:2025-04-18 ⋅ 阅读:(22) ⋅ 点赞:(0)

1 实验概述与背景

Stanford大学的CS144课程是计算机网络领域最著名的课程之一,其实验设计巧妙地引导学生从零开始实现一个TCP/IP协议栈。在这一系列实验中,Lab0是万里长征的第一步,通过实现以下两个核心组件,为后续的TCP协议实现奠定基础:

  1. 字节流(ByteStream)抽象:模拟可靠传输信道的基础抽象
  2. WebGet应用:使用系统提供的TCP实现来获取网页内容

本文将详细记录Lab0的实现过程。Github仓库地址

2 ByteStream的设计与实现

2.1 字节流抽象概述

ByteStream是什么?简单来说,它是一个FIFO(先进先出)的字节缓冲区,具有以下特性:

  • 有限容量:缓冲区容量固定,不能无限增长
  • 双向接口:Writer端写入,Reader端读取
  • 流结束控制:Writer可以关闭流,Reader可以检测流是否结束
  • 错误处理:可以设置和检测错误状态

ByteStream抽象在网络中的角色是模拟可靠的单向数据流,类似于TCP连接的一个方向。

2.2 实现思路

ByteStream总共有一下三个:

  1. ByteStream基类:包含共享的成员变量和方法
  2. Writer子类:负责写入操作的接口
  3. Reader子类:负责读取操作的接口

这种设计将读写权限分离,与实际的网络通信场景吻合:数据发送方只能写入,接收方只能读取。

在这里插入图片描述

2.3 核心数据结构

ByteStream的核心数据结构非常简单,主要包含以下几个成员变量:

uint64_t capacity_;     // 字节流的总容量
std::string buffer_;    // 内部缓冲区
bool closed_;           // 流是否已关闭
uint64_t bytes_pushed_; // 累计推入的字节数
uint64_t bytes_popped_; // 累计弹出的字节数
bool error_;            // 错误状态标志

这些变量共同维护了字节流的状态,使得Reader和Writer能够协同工作。

2.4 Writer实现细节

Writer负责向字节流中写入数据,主要实现以下几个方法。实现中需要注意的关键点:

  • push操作中检查流是否已关闭
  • 确保不超过可用容量
  • 正确计算available_capacity(已推入但未弹出的字节占用了容量)
void Writer::push(string data)
{
  // 如果流已关闭,直接返回
  if (is_closed()) {
    return;
  }

  // 计算可接受的字节数
  size_t can_accept = min(available_capacity(), data.size());
  
  // 只接受在容量范围内的数据
  if (can_accept > 0) {
    buffer_.append(data.substr(0, can_accept));
    bytes_pushed_ += can_accept;
  }
}

void Writer::close()
{
  closed_ = true;
}

bool Writer::is_closed() const
{
  return closed_;
}

uint64_t Writer::available_capacity() const
{
  return capacity_ - (bytes_pushed_ - bytes_popped_);
}

uint64_t Writer::bytes_pushed() const
{
  return bytes_pushed_;
}

2.5 Reader实现细节

Reader负责从字节流中读取数据,主要实现以下几个方法。实现中需要注意的关键点:

  • peek返回对缓冲区的视图,不修改数据
  • pop需要检查长度参数,避免越界
  • is_finished需要同时检查流是否关闭和缓冲区是否为空
string_view Reader::peek() const
{
  return string_view(buffer_);
}

void Reader::pop(uint64_t len)
{
  // 确保不弹出超过当前缓冲区大小的字节
  len = min(len, bytes_buffered());

  buffer_.erase(0, len);
  bytes_popped_ += len;
}

bool Reader::is_finished() const
{
  return closed_ && bytes_buffered() == 0;
}

uint64_t Reader::bytes_buffered() const
{
  return bytes_pushed_ - bytes_popped_;
}

uint64_t Reader::bytes_popped() const
{
  return bytes_popped_;
}

3 WebGet应用实现

完成ByteStream后,Lab0的第二部分:实现一个简单的Web客户端,能够使用HTTP协议从服务器获取网页内容。get_URL函数是WebGet的核心,实现如下:

void get_URL(const string& host, const string& path)
{
  // 创建TCP socket并连接到服务器
  TCPSocket socket;
  socket.connect(Address(host, "http"));
  
  // 构造HTTP请求
  string request = "GET " + path + " HTTP/1.1\r\n" + 
                   "Host: " + host + "\r\n" +
                   "Connection: close\r\n" +
                   "\r\n";
  
  // 发送HTTP请求
  socket.write(request);

  // 接收并处理HTTP响应
  string response;
  while (!socket.eof()) {
    string buffer;
    socket.read(buffer);
    response += buffer;
  }
  
  // 输出响应内容
  cout << response;
  
  // 关闭socket
  socket.close();
}

实现要点:

  1. HTTP请求格式:必须包含正确的换行符\r\n,这是HTTP协议的规范
  2. Connection: close:告诉服务器在响应后关闭连接
  3. 循环读取响应:由于不知道响应的具体大小,需要循环读取直到连接结束

网站公告

今日签到

点亮在社区的每一天
去签到