帮助一些关于系统发育树的入门指标?

计算科学 计算生物学
2021-12-07 01:32:32

我在做一个计算生物学项目,在其中我模拟不同继承规则集下的进化,我正在生成系统发育树(在 python 中使用 ete3 进行了漂亮的可视化,我推荐并可以在这里找到:http ://etetoolkit.org/download/

我的问题是:有人能指出我正确的方向来找到并测试一些简单的指标,这些指标可以用“分支”来描述这些树(你可以说我不是生物信息学家或系统发育学家!)。我正在寻找树木的平均场描述符。有点像网络的学位分布......

1个回答

在自然语言处理中,术语“bushy”和“straggly”用于描述句子语法分析的树结构。“浓密”的树木更平坦而不是更深。“散乱”的树深深地向右或向左分支。就指标而言,您可以使用树的深度以及Belay 等人量化的散乱度。

我们将句子的散乱度计算为树的最大深度(通过计算解析树的最大堆栈深度来计算)除以句子中的短语数(由解析树中的行数确定) . 此外,我们取每个句子的粗细度和散乱度的平均值和标准差,并将其用作特征。