分类的概念和技术
基本概念 定义:确定对象属于哪个预定义的目标类 输入数据:分类任务的数据是记录的集合 记录:实例或样例,用元组(x,y)表示;x是属性的集合,y则是一个特殊的属性,指出样例的类标号 区别分类与回归的关键特征: 类标号必须为离散属性 分类任务:通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y 目标函数(分类模型)可用于以下目的: 1.描述性建模 2.预测性建模 分类技术 定义:根据输入数据集建立分类模型的系统方法 例子:决策树分类法、基于规则的分类法、神经网络、支持向量机、朴素贝叶斯分类法 一般方法: 首先,需要一个训练集,由类标号已知的记录组成 然后,使用训练集建立分类模型 最后,分类模型随后将运用于检验集(检验集有类标号未知的记录组成) 分类模型的性能: 评判:根据模型正确和错误预测的检验记录计数(存放于混淆矩阵的表格中)进行评估 性能度量: 1.准确率=正确预测数/预测总数=f11+f00/(f11+f10+f01+f00) 1.准确率 =正确预测数/预测总数=f11+f00/(f11+f10+f01+f00) 1.准确率=正确预测数...
10.29 日常 | 游戏、比赛与地坛的记忆
今天上午上完微机原理课,便迎来了一个空闲的白天。回到寝室,索性沉浸在英雄联盟的世界里,从午后一直到天色渐晚。 五点多,和朋友特意去了另一个食堂换换口味。晚饭后,看了KT与CFO的比赛,又回顾了T1的对局,学习Faker沙皇的操作,那伤害确实有点爆炸。 游戏与比赛过后,是静心学习的时段。学了一会儿数据挖掘,并整理了部分笔记(分类与决策树归纳)。 随后,进入今天的阅读时光。今天的进度停留在《我与地坛》的第九章——《记忆与印象》。 作者回忆了自己与母亲的相处、与好友L的童年时光,以及其他一些印象深刻的人。隽永的文字中,满含对母亲的深切思念。 在今天的阅读中,作者提出了一个深刻的观点:人活着必须要有意义,因为人与意义本就是一体的。至于追求何种意义,则是个人的选择。他还阐释道,我们应当理解并珍视自己生活中的幸福,因为每种生活都有其自身的缺陷。活在自己的生活里,并尊重它,或许才是最好的选择。
10.28 日常 | 新工具、旧随笔与地坛的回声
今天是个小小的“工具革新日”。早晨,我将 Markdown 写作环境从 Typora 迁移到了 Obsidian,期待这个以“链接”见长的编辑器,能为我未来的笔记网络带来新的可能。 随后,我学习了计算机视觉中“点算子”的基础知识,接着去上计算机安全导论。中午尝了新开的一家牛肉饭,味道很不错,算是今日份的小确幸。 回到寝室,预习了晚上微机原理上机的内容,随后在召唤师峡谷稍作放松。今日的战绩胜负参半,有碾压局的畅快,也有逆风局的坚持。 下午,我静心整理了“点算子”的笔记,并将之前写的一篇随笔《印象最深刻的人》迁移到新的 Obsidian 库中。在整理与迁移中,仿佛也在重新梳理自己的思绪。 新的阅读之旅,始于史铁生的《我与地坛》。 今天读完了开篇两章。 《我与地坛》:那个因双腿残疾而将地坛作为心灵容器的青年,在寂静的园子里,与形形色色的路人相遇,也与生命最根本的问题劈面相遇——关于生死,关于为何写作。最动人心魄的,是他对母亲那份迟来的理解与深沉的愧疚,以及他对“幸福与不幸”相对相生的辩证思考。 《我二十一岁那年》:在友谊医院的病床上,身体的禁锢反而让他更清晰地看见了人间的温度。医生...
点算子
图像处理中的点算子与基础变换 一、 基本概念解析 算子:指从一个向量空间到另一个向量空间的映射。 伽马校正:对图像的伽马曲线进行编辑,通过非线性色调编辑来增强图像对比度,提亮深色部分,压暗浅色部分。 向量值函数:值域是线性空间或其子集的函数。在图像处理中,彩色图像通常被视为向量值函数。 色彩通道:保存图像颜色信息的通道(如RGB图像中的红、绿、蓝通道)。 标称:产品上标明的规格、数值等性能和质量要素。 二、 像素变换 图像处理算子是将一个或多个输入图像映射为一个输出图像的函数。 基本点算子 公式:g(x) = a * f(x) + b 参数a(> 0):增益参数,控制对比度。 参数b:偏置参数,控制亮度。 这些参数可以是全局的,也可以随空间位置变化。 乘法增益是一个线性算子,因为它遵从叠加原理。 线性混合算子 公式:g(x) = (1 - α) * f₀(x) + α * f₁(x) 参数α(0 到 1):混合系数。 应用:实现两幅图像或视频间的淡入淡出效果,也是图像变形算法的一部分。 伽马校正 性质:非线性算子。 作用:在图像预处理中,用于...
印象最深刻的人
那年盛夏,推开门,我抬起头,她也刚转过身。阳光肆意地亲吻她白的脸庞,一袭乌黑亮丽的头发披散着,似蹙非蹙的眉下,秋波流转,薄薄的嘴唇点着胭脂红,身着白色连衣裙,抱着一本泰戈尔的《飞鸟集》,如同一泓清水中荡漾的柔和月色。于是,一缕幽兰芬香被夏天的风吹散,在少年的心尖打转。少女抿着嘴,眸中原本的滟色敛去,只留被陌生人打扰的惊愕与疑惑,我匆忙道歉,轻轻关上门,转身跑开,分不清加快的心跳是否是跑步留下的痕迹。有些人,或许一眼,便住进心里。任岁月流过,在这间教室里,每个人都修剪着自己飞扬天空的羽翼,我也不例外,只是,闲暇之余,那日惊艳的兰香总会在心底沉浸。我没有打扰这份美好,毕竟世事哪能总如人意,徒留那年夏天便好。后来啊,那间教室仍在,我再也回不去当年,只是书桌上永远放着一本《飞鸟集》。我永远就在了那个夏天。
10.27 日常 | 理发,实验,与湖畔的终章
早晨上完算法课,顺路去理了发,仿佛也理清了连日积累的纷杂思绪。同时,也为计算机视觉和数据挖掘两门课购置了实体教材——此前以为电子书足以应付,终究是低估了知识的重量与翻阅的实在感。 午饭后,照例在英雄联盟的“海克斯大乱斗”中放松片刻。今天的战局颇为顺利,算是为下午的课程实验积攒了一些好心情。 下午的微机原理课后,取回了新买的枕头和冬季睡衣。一个小小的新枕头,承载的是对一夜安眠的朴实期望。回到寝室,便投入计算机视觉的实验一——“混合图像实验”,并一气呵成地完成了报告。 随后,便是今日最宁静的时光。我翻开了《瓦尔登湖》的尾篇,与梭罗在湖畔的两年时光做最后的对谈。今晚的几段文字,仿佛是他对整个实验的总结陈词: “如果人自信地朝着梦想的方向前进,努力去过上他事先设想的生活,他将会取得普通人想象不到的成功……他将会过上一种更为高尚的生活。” “只有在我们醒着时,天才是真正的破晓。” “我们总是以为,若是将我们的农场的篱笆拆掉,垒上石墙,我们的生活便自此有了边界,我们的命运也已经注定。” 合上书页,我的感悟如下: 梭罗记述了他在瓦尔登湖旁林中小屋一年的生活,并表达了他对生活对自然的思考 ...
10.26 日常 | 报告、对局与湖畔的冬天
早晨的清闲从一趟打印店开始。拿到昨天写好的《电子技术应用课设》报告,纸张还带着微温与墨香。走去实验楼交报告的途中,阳光正好,有种任务达成的轻快。 午饭后,惯例是属于自己的游戏时间。今天的召唤师峡谷战况有些焦灼,胜负交织,还穿插着几局“疯狂”的重开。有逆风翻盘的畅快,也有无力回天的遗憾,这或许就是竞技游戏的魅力所在——永远在不确定中寻找可能。 下午收心,开始撰写操作系统的第一次上机实验报告。当思维从激烈的团战切换到进程管理与系统调用,有一种从动荡重归秩序的安定感。代码与逻辑,是另一种形式的宁静。 晚上参加完晚点名,回到宿舍,继续我的湖畔阅读。今天结束于《瓦尔登湖》的“冬天的湖”一章。梭罗开始用更沉静的目光,描绘瓦尔登湖在冰封期的样貌,以及他与访客、村民之间简单而真实的交际。 他依旧在用斧头劈柴、测量湖深、接待来客这些具体的生活细节中,践行并传达着他的核心思想:回归自然,鄙弃那些浮华与喧嚣的世俗生活。 当湖面封冻,万物寂静,他反而更清晰地听到了内心的声音。这种在极简中对生活本质的触摸,在这个信息过载的时代,显得尤为珍贵。 今天,是在事务、对局与阅读中平静流转的一天。梭罗在湖畔迎来了...
10.25 日常 | 游戏、报告与更高的法则
早晨醒来,从新闻中得知今天被设立为 “台湾光复纪念日”。看到祖国在统一大道上又迈出坚实的一步,心中不禁升起一股宁静的欣慰。 早饭后,便沉浸在新出的“海克斯大乱斗”里。战局有来有回,胜负交织,倒也打得尽兴。最终的战绩还算不错,也算为周末开了个好头。 下午收敛心神,开始认真撰写《电子技术应用课程设计》的报告。当思维从虚拟战场切换回电路与逻辑的世界,有种从喧嚣重归秩序的踏实。 晚上传来消息,BLG 不敌 TES,止步十六强。我虽不是 BLG 的粉丝,主队始终是 iG,但看到任何一支承载着期望的队伍离场,总不免有些感慨。电竞如此,生活亦然——有人欢呼,就有人沉默,而我们都在自己的赛道上,迎接着属于各自的胜负。 夜深人静时,继续翻开《瓦尔登湖》。今天读到了“更高的法则”一节。梭罗在湖畔不仅耕种豆田,更在耕种自己的内心。他在质朴劳作与自然独处中,不断追问什么是人应该过的生活,什么是驱动我们前行的那束“更高的光”。 这让我想到白天的种种:在游戏中追求即时的胜负,在报告中构建严谨的逻辑,在新闻里关注家国的走向——这些看似分散的片段,或许都是我们回应内心“更高法则”的不同方式。我们都在寻找一种平...
10.24 日常 | 在群论与细雨之间
今天是周五,终于迎来了一个没有实验的周末,光是想到这一点,就让人心生欢喜。 白天的课程依旧紧凑。离散数学的进度触及了“群”这一抽象而优美的概念;数据库系统继续深入 SQL 语言的肌理;下午的数据挖掘课则推进到了贝叶斯模型。知识如潮水般涌来,我需要复习的内容,似乎也像秋天的叶子,越积越厚了。 晚上,一边吃饭,一边看了 T1 和 100T 的比赛。屏幕上的激烈交锋,仿佛在无声地陈述着那句经典:“如果未来是你的,证明给我看。”那种对胜利的纯粹渴望与极致专注,无论在哪个领域,都同样动人。 随后,是独属于我的宁静时刻——继续阅读《瓦尔登湖》。今晚的几段话,格外应和我的心境。 梭罗写道: “很多时候我不愿思考,也不愿劳动,只想好好地享受当前的良辰美景。我热爱生活中的闲暇时光。有时候,在夏天的早晨,依照习惯洗过澡之后,我就坐在阳光明媚的门口,从日出坐到正午,沉浸于幻想之中。” 在这样一个被知识和任务填满的周五,读到这样的句子,像是一种温柔的赦免。它提醒我,“无所事事”并非虚度,而是对生命本身最真诚的致敬。 他接着说道: “只要我们总是真正地去生活……那么沉闷乏味将和我们无缘。只要紧紧地跟...
data mining 2
第二章:数据挖掘中的数据 一、数据的基本概念 数据:由数据对象及其属性组成的集合。 属性:对象的特征或性质,也称为变量、字段、特征、维度。 对象:由一组属性描述,也称为记录、样本、实例、实体。 二、属性与属性值 属性值:赋予属性的数值或符号。 同一属性可以映射到不同的属性值(如高度可以用米或英尺表示)。 不同属性可能映射到相同的值集合(如ID和年龄都是整数,但含义不同)。 三、属性的类型 名义属性:表示类别,如ID、颜色、邮编。 序数属性:有顺序,如等级、高度(高/中/低)。 区间属性:有顺序和有意义差值,如日期、摄氏温度。 比例属性:具有所有四种性质(区分、顺序、差值、比例),如开尔文温度、长度。 四、属性的性质 区分性(=, ≠) 顺序性(<, >) 差值有意义(+, -) 比例有意义(×, ÷) 五、离散与连续属性 离散属性:有限或可数无限个值,如邮编、计数。 连续属性:实数值,如温度、重量。 六、数据质量 常见问题: 噪声 异常值 错误数据 缺失值 重复数据 处理方法: 删除对象/属性 估计缺失...













