树洞行动
Tree Hole Action
树洞技术

 

树洞与自杀风险分级标准

为了发现那些紧迫需要救助的自杀人群,我们提出了自杀风险分级。根据其自杀方式的确定性和时间紧迫性等因素来确定其风险。级别越高即自杀风险越高。具体的自杀风险分级标准如下表所示。

风险级别判断标准
10自杀可能正在进行中
9自杀方式已确定,近日内可能进行
8自杀已经计划中,自杀日期大体确定
7自杀方式已确定, 自杀日期未明
6自杀已经计划中,自杀日期未明
5强烈的自杀愿望,自杀方式未明
4自杀愿望已表达,具体方式和计划未明
3强烈的生存痛苦,未见自杀愿望表达
2生存痛苦已明确表达,未见自杀愿望表达
1生存痛苦有所表达,未见自杀愿望表达
0未见任何生存痛苦表达

 

树洞知识图谱

为了使智能机器人能够获得知识支撑,我们构造了树洞知识图谱,提供与自杀和抑郁症相关的各种基本知识,用于对抓取后的微博信息进行分析和判断。 知识图谱(Knowledge Graph)是采用语义技术形式表达的系统化结构化集成化的特定领域知识[1]。知识图谱能够集成各类复杂的知识与数据资源,成为了人工智能技术应用的一种重要方法。本体(ontology)可以被看做是一种特定类型的知识图谱,主要关注于超越具体个体的概念关联描述。知识图谱与本体已经成为面向万维网信息环境的最重要的知识表达形式。 知识图谱的优势在于结构化组织的知识库。通过对准确可靠的信息进行结构化地描述和关联组织,从而转化为知识图谱中的知识。知识图谱采用语义技术标准如RDF/RDFS/OWL语言来表达知识,提供了特定领域的专业化知识。 树洞知识图谱(Tree-hole Knowledge Graph)主要用于树洞机器人对社交媒体信息中所包含的自杀可能性进行判断。所以,树洞知识图谱需要覆盖自杀方式,自杀计划,痛苦表达,时间描述,地点描述,悼念模式等相关概念的描述。由于有许多现成的本体(如时间本体,空间本体)和相关的知识图谱(如抑郁症知识图谱)可供使用, 所以我们把树洞知识图谱涉及成可以通过不同的本体或知识图谱组合而成。目前的树洞知识图谱已经包含了下列几个独立的本体:

  • 自杀本体(Suicide ontology):目前的树洞机器人仅仅是监控六级以上自杀风险的人群,所以,目前的自杀本体只覆盖判断六级以上风险的相关概念,即自杀方式和自杀计划的描述。所以,我们构造的自杀本体由自杀方式(如跳楼,割腕,烧炭等)和自杀计划(如相约自杀,问自杀药等)两大类组成。
  • 时间本体(Time ontology):我们嵌入了规范的时间描述(https://www.w3.org/TR/owl-time/),同时加上了面向中文时间描述的本体。时间本体覆盖了绝对时间概念(如日历和节假日信息)和相对时间概念,如现在,将来,与过去等时间描述。
  • 空间本体(Space ontology):描述空间地理的相关概念。由于我们目前处理的自杀风险分类里面尚未覆盖对空间地理信息的判断,故在当前实现的网络智能机器人版本里面,暂时没有采用空间地理本体。
  • 愿望本体(desire ontology):用于刻画人的主观愿望及其相关的否定概念,如“很想”与它的否定(如不想),“应该”与它的否定“不该”等。主要用于分析特定人群的主观自杀愿望,和排除无主观自杀愿望的人群。
  •  

    树洞智能机器人的结构图

    它由下列几个处理模块组成:

  • 数据抓取:从树洞网站抓取当天的数据,生成对应的HTML格式的数据。数据抓取模块需要判断哪些树洞数据需要采集,哪些数据已经被采集,以避免重复性的工作。
  • 数据汇总:把抓取下来的HTML数据,对其包含的每一条信息提取其中我们关心的八个数据属性(日期,时间,发言ID,发言人的微博号,发言人网名,发言的内容,情感标志,回复对象的网名,回复对象的微博地址), 并生成一个对应的文件。
  • 数据分析:对汇总后的树洞数据进行。在这个环节上采用自然语言处理工具进行分词与句法解析。采用知识图谱通过推理分析,提取其中被认为是自杀风险在六级以上的信息。这个分析过程需要使用树洞知识图谱及其风险判别的规则算法。我们已经构造了面向从6级到10级自杀风险对应的描述性知识的判别规则。这些规则采用了基于逻辑程序语言Prolog中的定义子句文法(DCG,Definite Clause Grammars)知识转换规则(DCG Tranformation Rules)。我们对DCG规则加上了面向知识图谱推理能力的扩展性描述,从知识图谱中获得领域知识的理解来解读每一条信息,以决定其风险级别。
  • 报告生成:树洞机器人会生成类树洞监控通报
  •  

    Sponsors

    Vrije University

    Ztone International BV

    Wuhan University of Science and Technology