10.21 日常:独立灵魂与数据度量
在寂静中寻找自我的尺度
生活感悟:守护自我的独立性
今天继续翻阅《瓦尔登湖》,梭罗在湖畔的隐居生活,其核心并非逃离社会,而是捍卫精神的独立。他写道:
“我看到我的市民同胞们已不大可能在县政府办公大楼里给我谋求一个职位… 于是只好另谋出路,比以往更加专心地将脸转向了森林…”
这让我深有感触。我们常常不自觉地将自我价值寄托于外界的认可——一份体面的职位、他人的赞誉或是社会的常规路径。梭罗选择“转向森林”,象征性地告诉我们:当世界无法为你提供舞台时,你必须有能力为自己搭建一个。 真正的独立性,在于拥有一个不受外部市场与评价体系侵蚀的内核,能够自我定义价值与目标。
学习笔记:数据挖掘中的距离度量
今天学习了一点数据挖掘的基础知识,了解了如何用数学方法度量事物之间的“远近”或“相似性”。
- 欧氏距离
最直观的距离,就是我们日常生活中理解的“直线距离”。
d(x,y) = √( Σ(x_i - y_i)² ) - 明氏距离
这是一个更通用的距离函数家族,欧氏距离是它的一个特例。
d(x,y) = ( Σ|x_k - y_k|^r )^(1/r)
通过改变参数r,我们可以得到不同的度量方式:r = 1: 曼哈顿距离,也叫城市街区距离,好比在城市网格中行走的路径。r = 2: 欧氏距离。r = ∞: 上确界距离,取所有维度中差距最大的那一个。
- 马氏距离
这是一个更高级的概念,它考虑了数据各维度之间的相关性,是一种基于数据分布的距离,对于消除量纲和相关性影响非常有效。
mahalanobis(x,y) = ( (x-y)ᵀ ∑⁻¹ (x-y) )^0.5
(其中 ∑ 是协方差矩阵)
一点联想:学习这些距离度量时,我突然想到,在生活中我们衡量与他人、与理想的距离时,是否也用了错误的“度量公式”?我们是否像使用曼哈顿距离一样,被社会的网格化规则所束缚?或许,追求内心的独立,就是找到最适合自己的那个“公式”,去丈量真正重要的事物。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 笺札!





