研究 · Reported as measured

行为信号,
AI 的第三模态

继文本、图像之后,行为信号是 AI 的第三种感知模态。下面每一个数字都在论证这一件事。

这是一份研究记录,不是宣传册。进行中的论文、整理好的数据集、已撰写的专利、模型指标——每个数字都按实测如实报告,不往上凑整。是什么、怎么测出来的、该信几分。

9论文进行中
33数据集
15M行为动作
11专利已撰写
0.832坏周 AUC
如实报告
进行中的论文 · One finding each

九篇论文在准备中,
每行一篇,数字就是论据。

进行中 · 尚未同行评审

每一行就是一篇:它的主张,和支撑它的那一个量化结果——按实测如实报告,尚未经同行评审。顺着右列往下读。

论文清单 // PAPERS LEDGER09 / 09
  • P-01行为信号:AI 感知的第三模态20+ 数据集 2000 万动作里跑出 5-8 个潜在行为维度,压缩损失中位数 3%,跨模态压力预测 AUC 0.73。
  • P-02第二层:动作 pattern 能预测心理状态,强度不能动作 pattern 能预测心理状态,强度不能。仅摘要
  • P-03生产数据里的行为 pattern 能预测系统性下滑,平均值不能PCB 线一周状态预测:用动作 pattern AUC 0.832,用强度只有 0.688 (+0.144)。3 个数据集 12,764 条记录。
  • P-04人类行为变异的统一模型把 6 个行为科学传统合并成 6 个正交维度,120+ 引文,6 条可测预测在后续论文里验证。
  • P-05理论驱动的行为类型识别:基准研究8 个心理测量数据集、115 万参与者、18 个实验。仅 3 条信号冷启动余弦相似度 >0.969,跨维扩展 R² 升 48.1%。
  • P-06行为类型与自评类型互不相关行为类型与自评类型完全独立:Eisenberg 522 人 + IAT 10 万人 + CPC18 926 人,ARI = 0.007。
  • P-07人类行为变异的通用维度16 个数据集、58 万人 PCA:5 个通用维度 (准、快、量、稳、探);K=3 最优;周与周类型稳定度 67%。
  • P-08类型悖论类型对预测准度加 +0.0% (94.4%→94.41%),但类型匹配的干预能把成功率拉高 +11.6% (p<0.0001)。79-99.8% 的人横跨多个簇。
  • P-09动作维度,不是人的类型33 个数据集、1500 万动作、12 个领域。3 个通用动作维度 (节奏 39%、探索 22%、会话弧 15%) 合计解释 76.5% 方差;跨域 PCA 相似度 0.654。
模型背后的数据集 · The inputs

任何主张之前,
先是真实的数据

从公开与采集来源整理、校验,在这里点清——这样下游每一个数字都能追回到真实的东西。

33
数据集
公开与采集来源,逐一整理、校验。
15M
行为动作
构成模型学习的原始行为信号。
1.15M
参与者
覆盖的不同个体,用于检验泛化。
12
领域
不同任务类型,验证维度的通用性。
专利状态 // PATENT STATUS仅美国 · 已撰写 · 尚未提交
11
项专利已撰写

11 项在册专利,仅美国,均已撰写、尚未提交——这一点我们直说。我们只公布数量,不列方向:在提交之前,权利要求不公开。

模型指标,用人话讲 · AUC

0.5 等于抛硬币
1.0 为完全正确。

AUC 是模型把更差的那个排在更好的那个之前的概率。越高越好;下面两个数字,每个都用人话读一遍——模型在做什么、得了多少分。

“坏一周”预测 // BAD-WEEK
0.832
AUC

把谁正滑向“坏一周”排出来。

输入 · 一条 PCB 线上的动作时序 pattern。

处理 · 模型按“坏一周”风险给每个工人排序。

输出 · AUC 0.832——模型把即将进入“坏一周”的工人排在状态稳定者之前的概率就是这么高。同一件事,只用强度只有 0.688。

端侧 SDK // ON-DEVICE SDK
0.737
AUC

同样的排序,测在轻量级端侧模型上。

输入 · 信号少得多——只有端侧 SDK 能看到的那部分。

处理 · 同样的排序任务,跑在轻量级模型上。

输出 · AUC 0.737——排序质量在端侧 SDK 上依然立得住,而它用到的信号远少于完整流水线。

同一条线 · 同一个任务 // SAME LINE · SAME TASK
0.832
看“怎么做的”
动作时序 PATTERN
0.688
只看“做了多少”
强度单看

差距 +0.144。强度只告诉你产量;要提前一周读出“坏一周”,得看动作的 pattern。这就是行为信号作为第三模态的全部意义。

同一个橘子模型,从完整流水线到端侧 SDK——切片即数据流。

模拟引擎 · The test bed

数字在模拟引擎
先被反复打过。

试验台 · LIVE

上线之前,整套逻辑先在一个工厂模拟引擎里跑——因果规则明写出来,每一条都有测试盯着,多路数据流并行喂进去。

998项测试
21条因果规则
18路数据流
全部通过
项测试 // 项测试
998

每一条因果规则都有测试盯着。

条因果规则 // 条因果规则
21

明写出来的因果,不是黑箱关联。

路数据流 // 路数据流
18

并行喂进引擎的实时信号。