原文地址：Syslog : The Complete System Administrator Guide

原文作者：Schkn

译文出自：掘金翻译计划

本文永久链接：github.com/xitu/gold-m…

译者：githubmnume

校对者：todaycoder001, shixi-li, portandbridge

Syslog：系统管理员完整指南

如果你是系统管理员，或者只是一个普通的 Linux 用户，那么你很有可能至少使用过一次 Syslog。

在你的 Linux 系统上，几乎所有与系统日志相关的东西都与 Syslog 协议有关。

协议由埃里克·奥尔曼（伯克利大学）在 80 年代早期设计，它是一个规范，定义了任何系统上消息记录的标准。

是的……任何系统。

Syslog 并不依赖 Linux 操作系统，它也可以在 Windows 操作系统上使用，或者在任何实现 syslog 协议的操作系统上使用。

如果你想更多地了解 syslog 和通常的 Linux 日志记录，这可能是你应该阅读的教程。

以下是你需要了解的关于 syslog 的所有信息。

I – Syslog 的目的是什么？

Syslog 是生成、转发和收集在 Linux 实例上生成日志的标准。Syslog 定义了严重性级别和设施级别，有助于用户更好地理解其计算机上生成的日志。日志稍后可以在部署 Syslog 协议的服务器上分析和展示。

以下是 syslog 协议最初设计的几个原因：

定义体系结构：稍后将详细解释这一点，但是如果 syslog 是一个协议，它可能是具有多个客户端和服务器的完整网络体系结构的一部分。因此，我们需要定义角色，简而言之：你是接收、生成还是转发数据？
消息格式：syslog 定义了消息的格式化方式。这显然需要标准化，因为日志经常被解析并存储到不同的存储引擎中。因此，我们需要定义 syslog 客户端能够产生什么，syslog 服务器能够接收什么；
指定可靠性：syslog 需要定义它如何处理无法传递的消息。作为 TCP/IP 堆栈的一部分，syslog 显然会在底层网络协议（TCP 或 UDP）上被选择；
处理身份验证或消息真实性：syslog 需要一种可靠的方法来确保客户端和服务器以安全的方式进行交互，并且接收到的消息不会被更改。

现在我们知道最初为什么制定 Syslog，让我们看看 Syslog 架构是如何工作的。

II – 什么是 Syslog 架构?

当设计一个日志架构时，比如一个集中式日志服务器，很可能多个实例会一起工作。

有些实例将生成日志消息，它们将被称为“设备”或 “syslog 客户端”。

有些只是转发收到的消息，它们将被称为“中继”。

最后，在某些情况下，你将接收和存储日志数据，这些被称为“收集器”或 “syslog 服务器”。

了解这些概念后，我们可以说独立的 Linux 计算机本身就充当了 “syslog 客户端 – 服务器”：它生成日志数据，由 rsyslog 收集并存储到文件系统中。

这里有一组围绕这一原则的架构示例。

在第一种设计中，你有一个设备和一个收集器。这是最简单的日志架构形式。

在你的基础架构中添加一些更多的客户端，你就拥有了集中式日志架构的基础。

多个客户端正在生成数据，并将其发送到负责聚合和存储客户端数据的集中式 syslog 服务器。

如果我们要复杂化我们的架构，我们可以添加一个“中继”。

例如，中继可以是 Logstash 实例，但在客户端也可以是 rsyslog 规则。

这些中继大多充当“基于内容的路由器”（如果你不熟悉基于内容的路由器，这里有一个链接便于你理解它）。这意味着基于日志内容，数据将被重定向到不同的位置。如果你对数据不感兴趣，也可以将其完全丢弃。

现在我们已经有了详细的 Syslog 组件，让我们看看 Syslog 消息是什么样子的。

III – Syslog 消息格式是什么？

Syslog 格式分为三个部分：

PRI 部分：详细说明消息优先级（从调试消息到紧急事件）以及设施级别（邮件、授权、内核）；
HEADER 部分：由时间戳和主机名两个字段组成，主机名是发送日志的计算机名；
MSG 部分：该部分包含发生事件的实际信息。它也分为 TAG 和 CONTENT 字段。

在详细描述 syslog 格式的不同部分之前，让我们快速了解 syslog 的严重性级别以及系统日志设施级别。

a – 什么是 Syslog 设施级别？

简单来说，设施级别用于确定生成日志的程序或系统的一部分。

默认情况下，系统的某些部分会被赋予功能级别，例如使用 kern 功能的内核，或者使用邮件功能的邮件系统。

如果第三方想要记录日志，它可能会保留一组从 16 到 23 的设施级别，称为**“本地使用”设施级别**。

或者，他们可以使用“用户级别”工具，这意味着他们可以记录与执行命令的用户相关的日志。

简而言之，如果我的 Apache 服务器由 “apache” 用户运行，那么日志将存储在一个名为 “apache.log” 的文件中（.log）

下表描述了 Syslog 设施级别：

Numerical Code	Keyword	Facility name
0	kern	Kernel messages
1	user	User-level messages
2	mail	Mail system
3	daemon	System Daemons
4	auth	Security messages
5	syslog	Syslogd messages
6	lpr	Line printer subsystem
7	news	Network news subsystem
8	uucp	UUCP subsystem
9	cron	Clock daemon
10	authpriv	Security messages
11	ftp FTP	daemon
12	ntp NTP	subsystem
13	security	Security log audit
14	console	Console log alerts
15	solaris-cron	Scheduling logs
16-23	local0 to local7	Locally used facilities

这些级别你是不是很眼熟？

是的！在 Linux 系统中，默认情况下，文件由设施名称分隔，这意味着你将有一个用于身份验证的文件（auth.log），一个用于内核的文件（kern.log）等等。

这是我的 Debian 10 实例的截屏示例.

现在我们已经看到了 syslog 设施级别，让我们来描述什么是 syslog 严重性级别。

b – Syslog 严重性级别是什么？

Syslog 严重级别用于事件的严重程度，范围从调试、信息消息到紧急级别。

与 Syslog 设施级别相似，严重性级别分为 0 到 7 的数字类别，0 是最紧急的紧急级别。

下表中描述的是 syslog 严重性级别：

Value	Severity	Keyword
0	Emergency	`emerg`
1	Alert	`alert`
2	Critical	`crit`
3	Error	`err`
4	Warning	`warning`
5	Notice	`notice`
6	Informational	`info`
7	Debug	`debug`

即使默认情况下日志是按设施名称存储的，你也可以完全按事件的严重性级别来存储它们。

如果你使用 rsyslog 作为默认系统日志服务器，你可以检查 rsyslog 属性 配置日志的分隔方式。

现在你对设施和严重性有了更多的了解，让我们回到 syslog 消息格式。

c – PRI 部分是什么？

PRI 块是 syslog 格式消息的第一部分。

PRI 在尖括号之间存储“优先级值”。

还记得你刚刚学到的设施和严重程度吗？

如果你使用消息设施号，将其乘以 8，并加上严重性级别，你将获得 syslog 消息的“优先级值”。

如果你希望将来解码你的 syslog 消息，请记住这一点。

d – HEADER 部分是什么？

如前所述，HEADER 部分由两个关键信息组成: TIMESTAMP 部分和 HOSTNAME 部分(有时可以解析为一个 IP 地址)

该 HEADER 部分直接连着 PRI 部分，正好在右尖括号之后。

值得注意的是 TIMESTAMP 部分的格式是 “Mmm dd hh:mm:ss” 格式，“Mmm” 是一年中一个月的前三个字母。

谈到 HOSTNAME ，它通常是在你键入 HOSTNAME 命令时给出的。如果找不到，将为其分配主机的 IPv4 或 IPv6。

IV – Syslog 消息传递是如何工作的？

发布 Syslog 消息时，你需要确保使用可靠和安全的方式来传递日志数据。

Syslog 在这方面当然也自有一套想法，下面是这些问题的一些解答。

a – syslog 转发是什么？

Syslog 转发包括将客户端日志发送到远程服务器，以便对其进行集中记录，从而使日志分析和可视化更加容易。

大多数情况下，系统管理员不是监控一台机器，而是需要现场和远程监控几十台机器。

因此，使用不同的通信协议（如 UDP 或 TCP）将日志发送到称为集中式日志服务器的远程机器是一种非常常见的做法。

b – Syslog 使用 TCP 还是 UDP ？

根据 RFC 3164规范的规定，syslog 客户端使用 UDP 向系统日志服务器发送消息。

此外，Syslog 使用端口 514 进行 UDP 通信。

但是，在最近的 syslog 实现中，例如 rsyslog 或 syslog-ng，你可以使用 TCP (Transmission Control Protocol) 作为安全的通信通道。

例如，rsyslog 使用端口 10514 进行 TCP 通信来确保传输链路中没有数据包丢失。

此外，你可以基于 TCP 使用 TLS/SSL 协议来加密系统日志数据包，确保不会出现中间人攻击来监视你的日志。

如果你对 rsyslog 感兴趣，这里有一个关于如何以安全可靠的方式设置一个完整的集中式日志服务器的教程。

V – 当前的 Syslog 实现有哪些？

Syslog 是一个规范，但不是 Linux 系统中的实际实现。

以下是 Linux 上当前 Syslog 实现的列表：

Syslog daemon：发布于 1980 年，syslog 守护程序可能是第一个实现，并且只支持有限的一组功能（如 UDP 传输）。它通常被称为 Linux 上的 sysklogd 守护程序；
Syslog-ng：syslog-ng 于 1998 年发布，它扩展了原始 syslog daemon 的功能集，包括 TCP 转发（从而增强了可靠性）、TLS 加密和基于内容的过滤器。你还可以将日志存储到本地数据库中以供进一步分析。

Rsyslog：rsyslog 于 2004 年由 Rainer Gerhards 发布，是大多数实际 Linux 发行版（ Ubuntu、RHEL、Debian 等）上的默认 syslog 实现）。它提供了与 syslog-ng 相同的转发功能，但是它允许开发人员从更多的来源（例如 Kafka、文件或者 Docker）中选择数据

VI – 什么是日志最佳实践？

在操作系统日志或构建完整的日志架构时，你需要了解一些最佳实践：

除非你愿意丢失数据，否则请使用可靠的通信协议。 在 UDP（一种不可靠的协议)和 TCP（一种可靠的协议）之间进行选择真的很重要。提前做出这个选择；
使用 NTP 协议配置你的主机： 当你想要使用实时日志调试时，最好让主机同步，否则很难准确调试事件；
保护好你的日志： 使用 TLS/SSL 协议肯定会对你的实例产生一些性能影响，但是如果你要转发身份验证或内核日志，最好对它们进行加密，以确保没有人能够访问关键信息；
你应该避免过度记录： 定义好的日志策略对你的公司至关重要。例如，你必须决定你是否有兴趣存储（并且基本上消耗带宽）信息日志或调试日志。例如，你可能只对错误日志感兴趣；
定期备份日志数据： 如果你关注保留敏感日志，或者如果你定期接受审计，你可能在有关的外部驱动器或正确配置的数据库上备份日志；
设置日志保留策略： 如果日志太旧，你可能会有兴趣丢弃它们，也称为“轮换”它们。该操作是通过 Linux 系统上的 logrotate 实用程序完成的。

VII – 结论

对于愿意深入了解服务器中的日志功能如何运作的系统管理员或 Linux 工程师来说，syslog 协议绝对是经典之作。

然而，有理论的时候，也有实践的时候。

那么你应该做什么？你有多种选择。

你可以从在你的实例上设置syslog 服务器开始，例如 Kiwi Syslog 服务器，并开始从中收集数据。

或者，如果你有更大的基础架构，你可能应该首先建立 集中式日志体系结构, 然后使用非常现代的工具如 Kibana 可视化工具对其进行监控。

我希望你今天学到了一些东西。

活在当下，一如既往地享受乐趣。

如果发现译文存在错误或其他需要改进的地方，欢迎到掘金翻译计划对译文进行修改并 PR，也可获得相应奖励积分。文章开头的 本文永久链接 即为本文在 GitHub 上的 MarkDown 链接。

掘金翻译计划是一个翻译优质互联网技术文章的社区，文章来源为掘金上的英文分享文章。内容覆盖 Android、iOS、前端、后端、区块链、产品、设计、人工智能等领域，想要查看更多优质译文请持续关注掘金翻译计划、官方微博、知乎专栏。

今天的文章[译] Syslog：系统管理员完整指南分享到此就结束了，感谢您的阅读。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/19916.html

[译] Syslog：系统管理员完整指南