在计算机科学中,图是一种关键的数据结构,用于描述对象之间的关联关系。它由一组节点(也称顶点)和连接这些节点的边构成,广泛应用于社交网络分析、路径搜索、推荐系统等多个领域。
图可以分为有向图和无向图两类。在有向图中,边具有明确的方向,例如从节点A指向节点B;而在无向图中,边是双向的,表示两个节点相互连接。此外,图还可以是加权的,即每条边上附带一个数值,常用来表示距离、成本或权重。
邻接表是一种高效的图存储方法,特别适用于稀疏图——也就是边的数量远小于顶点数平方的情况。其核心思想是为每个顶点维护一个链表,记录所有与其直接相连的邻接顶点。
相比于邻接矩阵,邻接表在空间使用上更加节省,并且支持动态添加和删除边,灵活性更高。
// 定义图的邻接表表示
type Graph struct {
vertices int
adjList map[int][]int
}
// 初始化一个包含v个顶点的图
func NewGraph(v int) *Graph {
return &Graph{
vertices: v,
adjList: make(map[int][]int),
}
}
// 添加一条从u到v的边
func (g *Graph) AddEdge(u, v int) {
g.adjList[u] = append(g.adjList[u], v) // 有向图
// 若为无向图,还需添加反向边:g.adjList[v] = append(g.adjList[v], u)
}
AddEdge 方法动态插入新边| 表示方法 | 空间复杂度 | 适用场景 |
|---|---|---|
| 邻接表 | O(V + E) | 稀疏图 |
| 邻接矩阵 | O(V) | 稠密图 |
graph TD A --> B A --> C B --> D C --> D
图是由顶点集合和边集合组成的非线性数据结构,能够有效表达实体间的多对多联系。每个顶点可通过边与其他多个顶点相连,边可带有方向(有向图)或数值(加权图)。
该结构结合数组与链表的优点:数组下标对应各个顶点,每个元素指向一条链表,链表中保存所有与该顶点相邻的节点信息。
type Graph struct {
vertices int
adjList []([]int)
}
func NewGraph(v int) *Graph {
return &Graph{
vertices: v,
adjList: make([][]int, v),
}
}
func (g *Graph) AddEdge(src, dest int) {
g.adjList[src] = append(g.adjList[src], dest)
}
在上述 Go 实现中:
adjList
这是一个二维切片,其中每一个子切片存放从对应顶点出发的所有邻接点。添加边的时间复杂度为 O(1),整体结构简洁且性能良好。
在构建图之前,需先明确定义顶点和边的结构体,以便准确描述节点及其连接关系。
通常用结构体封装顶点属性,如编号、名称或其他元数据:
typedef struct Vertex {
int id; // 顶点唯一标识
char* data; // 存储附加信息
} Vertex;
这种设计便于后续功能扩展,
id
可用于快速索引定位,
data
则可用于存储额外的信息,提升实用性。
边可被定义为连接两个顶点的关系单元:
typedef struct Edge {
Vertex* src; // 源顶点
Vertex* dest; // 目标顶点
int weight; // 权重,无权图可设为1
} Edge;
src
与
dest
指针共同实现灵活的节点连接,
weight
支持带权图的应用需求。
| 结构 | 用途 | 适用场景 |
|---|---|---|
| Vertex | 表示图中的节点 | 所有类型的图结构 |
| Edge | 表示节点之间的连接 | 邻接表或边列表结构 |
在C语言中,动态内存分配是实现可变长数据结构的关键技术。利用
malloc
、
calloc
和
free
函数,可以在程序运行期间按需申请和释放堆内存,尤其适用于链表这类需要频繁增删节点的结构。
每个链表节点包含数据域和指向下一节点的指针域。通过调用
malloc
为其分配堆空间,确保节点独立存在且不会随函数退出而失效。
struct Node {
int data;
struct Node* next;
};
struct Node* create_node(int value) {
struct Node* node = (struct Node*)malloc(sizeof(struct Node));
if (!node) {
perror("Memory allocation failed");
exit(EXIT_FAILURE);
}
node->data = value;
node->next = NULL;
return node;
}
在此段代码中,
malloc
负责为新节点分配内存,若分配失败则终止程序执行;成功后返回有效指针,供后续链表插入使用。
malloc
NULL
free()
NULL
构建图的核心在于动态地添加顶点和边。通常采用哈希表来存储每个顶点及其对应的邻接顶点集合,从而实现高效的查找与更新。
为保证唯一性,每次添加新顶点前需判断其是否已存在:
func (g *Graph) AddVertex(v string) {
if _, exists := g.vertices[v]; !exists {
g.vertices[v] = make(map[string]bool)
}
}
此方法仅在顶点不存在时才初始化其邻接集合,平均时间复杂度为 O(1)。
添加一条从 u 到 v 的有向边。如果是无向图,则还需反向添加一次:
func (g *Graph) AddEdge(u, v string) {
g.AddVertex(u)
g.AddVertex(v)
g.vertices[u][v] = true
}
该过程会自动补全缺失的顶点,并建立正确的连接关系。
| 操作 | 时间复杂度 | 说明 |
|---|---|---|
| AddVertex | O(1) | 基于哈希表的插入操作 |
| AddEdge | O(1) | 两次查找加一次映射设置 |
为了保障内存安全和程序稳定性,合理的初始化与资源回收机制至关重要。将这两个过程进行封装,有助于减少资源泄漏风险并提高代码可维护性。
typedef struct ArcNode {
int adjvex;
struct ArcNode* next;
} ArcNode;
typedef struct {
ArcNode** heads;
int vertexNum;
} AdjListGraph;
在该结构中,
heads
是一个指向指针数组的指针,每个元素指向一个边链表头节点;
vertexNum
用于记录当前图中顶点的总数。
void initGraph(AdjListGraph* graph, int n) {
graph->vertexNum = n;
graph->heads = (ArcNode**)calloc(n, sizeof(ArcNode*));
}
使用
calloc
分配内存并清零,确保所有链表头指针初始为 NULL,防止野指针引发异常。
这一系列步骤确保了所有动态分配的内存都被正确回收,符合资源管理的最佳实践。
深度优先搜索(DFS)是一种通过递归深入探索图或树结构的算法。它的核心策略是沿着一条路径尽可能深入,直到无法继续为止,然后回溯到上一个节点尝试其他分支。
“回溯”是该算法的关键所在:当某条路径走到底但未找到目标时,系统会返回至上层节点,转向未访问过的相邻节点继续探索。
def dfs(graph, node, visited):
if node not in visited:
print(node)
visited.add(node)
for neighbor in graph[node]:
dfs(graph, neighbor, visited)
在该代码片段中,
visited
集合用于标记已访问的节点,防止重复处理;
graph[node]在深度优先搜索(DFS)过程中,准确记录遍历路径并管理节点的访问状态至关重要。为避免因重复访问导致的无限循环,通常采用布尔数组或集合来标记已访问的节点。
visited
上述实现中,
visited用于控制节点的访问状态,防止重复处理;而path则实时记录搜索路径。在回溯阶段,通过切片截断的方式撤销路径,确保后续分支搜索不受干扰。
func dfs(node int, graph [][]int, visited []bool, path *[]int) {
visited[node] = true
*path = append(*path, node) // 记录当前路径
for _, neighbor := range graph[node] {
if !visited[neighbor] {
dfs(neighbor, graph, visited, path)
}
}
*path = (*path)[:len(*path)-1] // 回溯:移除当前节点
}
递归算法依赖系统调用栈,但在深度较大的情况下容易引发栈溢出。通过显式使用栈数据结构,可将递归转换为非递归形式,提升稳定性和控制灵活性。
核心思路:将递归中的参数和状态压入自定义栈中,用循环代替函数调用。每次从栈中取出一个状态进行处理,并根据情况将子问题重新入栈。
代码示例:非递归后序遍历二叉树
stack st;
TreeNode* lastVisited = nullptr;
while (root || !st.empty()) {
if (root) {
st.push(root);
root = root->left;
} else {
TreeNode* peek = st.top();
if (peek->right && lastVisited != peek->right) {
root = peek->right;
} else {
cout << peek->val << " ";
lastVisited = st.top(); st.pop();
}
}
}
该实现通过栈模拟系统调用栈的行为,借助
lastVisited标记判断右子树是否已被处理,从而保证左→右→根的遍历顺序。相比递归方式,这种方法更可控,尤其适用于深度较大的树结构。
BFS(广度优先搜索)采用逐层扩展的策略,从起始节点出发,先访问其所有邻接点,再依次访问这些邻接点的未访问邻居,确保按最短路径顺序探索图结构。
队列的关键作用:BFS使用FIFO队列维护待处理节点,保障先进先出的处理顺序,从而实现层级遍历的正确性。
from collections import deque
def bfs(graph, start):
visited = set()
queue = deque([start])
visited.add(start)
while queue:
node = queue.popleft() # 取出队首节点
for neighbor in graph[node]: # 遍历邻接节点
if neighbor not in visited:
visited.add(neighbor)
queue.append(neighbor) # 新节点入队
代码中,
deque实现高效的入队和出队操作,配合visited集合防止重复访问,使整个图遍历过程可在O(V + E)时间内完成。
循环队列通过复用已释放的空间,有效解决普通队列可能出现的“假溢出”问题,广泛应用于嵌入式系统和实时通信场景。
基本结构定义
typedef struct {
int *data;
int front;
int rear;
int capacity;
} CircularQueue;
该结构体包含动态数组指针
data、队头索引front、队尾索引rear以及最大容量capacity。其中,rear指向下一个插入位置,front指向当前队首元素。
核心操作逻辑
rear,出队时更新front初始化需动态分配内存并设置初始状态;入队前必须检查是否已满;出队后应返回值并移动队头指针。
层次遍历的基本实现
层次遍历(Level-order Traversal)基于队列结构,按照树的层级从左到右依次访问每个节点。以下为二叉树层次遍历的代码示例:
from collections import deque
def level_order(root):
if not root:
return []
result, queue = [], deque([root])
while queue:
node = queue.popleft()
result.append(node.val)
if node.left:
queue.append(node.left)
if node.right:
queue.append(node.right)
return result
该算法时间复杂度为 O(n),每个节点仅入队和出队一次。使用双端队列可优化头部弹出效率。
最短路径的图论视角
在无权图中,BFS天然具备寻找最短路径的能力。当首次到达目标节点时,所经历的路径即为最短路径。
在分布式系统中,判断节点之间的连通性是保障服务可用性的基础任务。BFS因其逐层扩展特性,非常适合用于检测任意两节点间是否存在可达路径。
网络拓扑连通性验证
将网络设备抽象为图的顶点,连接关系作为边,构建无向图模型。从任一节点启动BFS,标记所有可达节点,未被访问的节点即为孤立或不连通设备。
from collections import deque
def is_connected(graph, start, target):
visited = set()
queue = deque([start])
visited.add(start)
while queue:
node = queue.popleft()
if node == target:
return True
for neighbor in graph[node]:
if neighbor not in visited:
visited.add(neighbor)
queue.append(neighbor)
return False
该函数从指定起始节点出发,利用队列实现层级扩展,visited集合防止重复访问。一旦目标节点被访问到,立即返回True。整体时间复杂度为O(V + E),适用于大规模稀疏图场景。
时间复杂度的实际影响
在真实应用场景中,算法的时间复杂度直接影响系统的响应速度。例如,在处理百万级用户推荐列表时,若使用O(n)的冒泡排序,耗时可能超过数分钟;而改用O(n log n)的快速排序后,执行时间可压缩至毫秒级别。
优化策略包括:
// 使用哈希表缓存已计算的斐波那契数
var cache = make(map[int]int)
func fib(n int) int {
if n <= 1 {
return n
}
if val, exists := cache[n]; exists {
return val // 避免重复递归
}
cache[n] = fib(n-1) + fib(n-2)
return cache[n]
}
此外,在分布式环境下,算法的设计还需考虑可扩展性、通信开销与负载均衡等因素,以适应海量数据处理需求。
在处理超大规模数据集时,传统的单机算法通常难以满足性能需求。以词频统计任务为例,借助 MapReduce 模型可将原本耗时数小时的计算任务分配至集群中进行并行处理,显著提升执行效率。
// 定义图的邻接表表示
type Graph struct {
vertices int
adjList map[int][]int
}
// 初始化一个包含v个顶点的图
func NewGraph(v int) *Graph {
return &Graph{
vertices: v,
adjList: make(map[int][]int),
}
}
// 添加一条从u到v的边
func (g *Graph) AddEdge(u, v int) {
g.adjList[u] = append(g.adjList[u], v) // 有向图
// 若为无向图,还需添加反向边:g.adjList[v] = append(g.adjList[v], u)
}
| 算法类型 | 单机处理上限 | 集群扩展能力 |
|---|---|---|
| DFS 遍历 | 10^5 节点 | 有限 |
| BSP 并行图计算 | 无硬性限制 | 强 |
系统设计中引入了动态适应机制:当监测到请求延迟超过预设阈值时,自动触发异步降级策略,切换至近似计算算法(例如 HyperLogLog),同时持续监控结果的误差率,并在条件允许时动态恢复至精确算法流程。
扫码加好友,拉您进群



收藏
