来源:广州中医药大学 作者: 黄艳茜|邓高丕 发布时间:2015/4/22 12:01:23 浏览人次:1622
摘 要
研究目的:
异位妊娠(ectopic pregnancy,EP)是指受精卵着床于子宫体腔以外的任何部位的妊娠。异位妊娠是妇科的常见急症之一,发病率约1%,其中输卵管妊娠约占异位妊娠发病率的95%。由于诊断异位妊娠的手段不断提高,使得异位妊娠早发现、早诊断、早治疗得以实现,使患者减轻痛苦,增加再次宫内妊娠结局的可能性。而判断疾病预后却没有一个统一的预测模型。本研究致力于构建一个决策树预测模型,通过对符合标准的病例进行收集、预处理,最后输出决策树模型,可以准确地预测出疾病的预后。
方法:
收集2011年至2013年在广州中医药大学第一附属医院妇科住院病人,出院诊断明确为异位妊娠的患者,最终收集病例数161例。以SPSS 13.0录入数据,预处理数据,建立数据库并导入Clementine 12.0进行统计。
结果:
1、本次研究共收集了有效病例161例,治疗有效141例,治疗无效20例,总有效率94.63%。其中中药治疗组93例,有效79例,无效14例,有效率84.9%;中西药治疗组68例,有效62例,无效6例,有效率91.176%。
2、中西药治疗组得出5个重要变量,为血hCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史。这5个变量的信息增益分别为0.388、0.236、0.125、0.125、0.125。当血hCG值≤2449.39IU/L时,中西药治疗组成功率为96.552%,比更高血hCG值时明显提高。
3、中药治疗组得出4个重要变量,为血hCG值、首次孕酮值、腹痛情况、有无阴道流血。这4个变量的信息增益分别为0.43、0.289、0.141、0.141。
4、中药治疗组及中西药治疗组均发现,血hCG值及首次孕酮值对病情预后具有决定性预测力,其中血hCG值最为重要,同时,联合月经是否规律、有无阴道流血、有无自然流产史、腹痛情况等另外4个变量,可更加准确预测疾病预后。其余变量信息增益可忽略不计。
结论:
本研究构建的决策树模型可以准确地预测异位妊娠药物组治疗病情预后。而血hCG值、首次孕酮值对病情预后具有决定性预测力,其中血hCG值最为重要,同时,联合月经是否规律、有无阴道流血、有无自然流产史、腹痛情况等另外4个变量,可更加准确预测疾病预后。
关键词:异位妊娠;决策树;预测模型;数据挖掘
引 言
异位妊娠(ectopic pregnancy,EP)是指受精卵着床于子宫体腔以外的任何部位的妊娠。异位妊娠是妇科的常见急症之一,发病率约1%,其中输卵管妊娠约占异位妊娠发病率的大多数。异位妊娠一旦破裂出血,可危及生命,一直都受到一线临床医生的高度重视。
由于随着社会的发展,人们观念、生活习惯的不断改变,异位妊娠发病率在我国有逐年升高趋势。有研究指出自80年代至今,现阶段我国异位妊娠患者的发病年龄逐渐年轻化,未婚未育患者比例增加,其中宫腔手术史、盆腔感染史、吸烟史是目前异位妊娠发病的重要高危因素。
由于早期异位妊娠诊断及治疗方案选择的困难性,提高异位妊娠的确诊率及如何选择最佳治疗方案,成为许多临床医生的挑战。导师邓高丕教授经过近十年的临床经验总结及研究,在输卵管妊娠辨病辨证的基础上,经过718例回顾性研究,150例前瞻性研究及796例回顾性评价,创立“输卵管妊娠病情影响因子评分”及“输卵管妊娠中西医结合治疗方案”。此方案自2006年应用于临床,至今已有效解决许多临床问题。经过7年的临床应用,对于异位妊娠药物组治疗病情预后进行预测,需要我们进行进一步研究及总结。本文致力于构建一个决策树预测模型,以期为本病的预后评价提供新的证据。
第一部分 文献研究
1 中医治疗异位妊娠研究及进展
1.1 中医病名
凡受精卵在子宫体腔以外着床发育,称为异位妊娠[1]。中医古籍文献中无此病名,但是在“妊娠腹痛”“妊娠下血”“少腹瘀血”“癥瘕”等病证中皆有类似的描述。如张仲景在《金匮要略?妇人妊娠病脉证并治》中提到以当归芍药散治“妇人怀娠,腹中休痛”[2],以附子汤治“妇人怀娠六七月,脉弦发热,其胎愈胀,腹痛恶寒者,少腹如扇,所以然者,子藏开故也”[2]及胶艾汤治“妇人有漏下者,有半产后因续下血都不绝者,有妊娠下血者,假令妊娠腹中痛,为胞阻”[2];再如王清任在《医林改错》当中提出以少腹逐瘀汤治“少腹瘀血积块疼痛或不痛,或痛而无积块,或少腹胀满,或经期腰疫少腹胀,或月经一月见三、五次,经色或紫或黑,或有瘀块,或崩漏兼少腹疼痛等”[3]。至近现代方统一病名为异位妊娠。
1.2 中医病因病机
中医学认为异位妊娠的发病机制与少腹素有瘀滞,冲任不畅而致孕卵未能移行胞宫;或先天肾气不足或者气虚送运无力,孕卵不能及时到达胞宫等因素有关。在异位妊娠未破损期,病机以少腹血瘀,瘀滞脉络为主;当孕卵阻滞日久,涨破脉络的已破损期时,则阴血内溢少腹,可发生正虚血瘀、气血两亏、晕厥等一系列症候[4]。包括以下5个方面[5]:
1.2.1胎元阻络
由于平素抑郁,或忿怒过度,气滞血瘀,或经行产后,余血未净,房事不节,或感染邪毒,邪与血结,乘虚内侵,冲任、胞脉失畅,孕卵受阻,不能运达胞宫,而成异位妊娠。
1.2.2胎瘀阻滞
孕卵停滞脉络,不能运达胞宫,继而胎元自损,胎元与淤血互结于胞络,但尚未破损,而成异位妊娠。
1.2.3气血亏脱
胎元阻滞于脉络,渐长而涨破脉络,则阴血内溢少腹,致厥脱重症。
1.2.4气虚血瘀
胎元阻滞于脉络自损,损坏脉络,阴血内溢少腹但量较气血亏脱少,气随血脱,成为异位妊娠。
1.2.5瘀结成癥
胎元久停于脉络,或伴离经之血,逐渐成癥,久积少腹,成为异位妊娠。
总而言之,异位妊娠的基本病因病机是血瘀或者气虚而致胎元阻络[6],而胎瘀阻滞、气虚血瘀、气血亏脱、瘀结成癥则是此病的病理病机。
1.3中医辨证论治
以往课本或者文献指出,异位妊娠分型为未破损期,已破损期的休克型、不稳定型、包块型[7]。而邓高丕等人[8]在对868例异位妊娠病例进行回顾性研究及前瞻性研究后,原有异位妊娠的证型基础上,与时俱进,根据早期异位妊娠的病情变化,将其改进并优化为新的异位妊娠中医证型,“未破损期”分为“胎元阻络”及“胎瘀阻滞”,“已破损期”分为“气血亏脱”、“正虚血瘀”和“瘀结成癥”,并写进教材。具体表现及证型[9]如下:
1.3.1未破损期
1.3.1.1胎元阻络型
“胎元阻络型”是指在异位妊娠未破损的早期时,异位孕卵仍存活、阻滞冲任、胞脉及胞络。临床可表现为停经,或伴有不规则阴道流血,或有一侧甚则全下腹隐痛,触诊一侧附件可有包块或压痛,尿或血HCG阳性,或经妇科B超证实为输卵管妊娠尚未破裂,脉弦滑。其主要病机为孕卵停滞脉络,不能运达胞宫,胎元与淤血互结于胞络,但尚未破损,治疗方法以活血化瘀杀胚为主。因胎元未亡,病情有下一步发展的趋势,应严密监测患者的生命体征、妊娠包块的变化及HCG值,若治疗过程中病情未得到控制则应马上改变治疗措施,防耽误病情。
1.3.1.2胎瘀阻滞型
“胎瘀阻滞型”指异位妊娠在未破损的晚期时,胎元已亡,继结而成瘀,胎元伴淤血阻滞冲任脉络。临床可表现为停经,下腹坠胀不适,有不规则阴道流血,HCG阴性,少腹或有局限性包快,舌质暗,脉弦细涩。其主要病机为孕卵停滞脉络,不能运达胞宫,继而胎元自损,胎元与淤血互结于胞络,但尚未破损,此时杀胚已不甚重要,首要问题是疏通瘀阻的冲任胞络,从而促进包块吸收,治疗上宜采用活血化瘀消癥为主。
1.3.2已破损期
1.3.2.1气血亏脱型
“气血亏脱型”是指异位妊娠包块破损后,出现急性大出血,气随血脱、阴阳离绝是其主要的病机特点。临床可表现为突发下腹剧痛,面色苍白,四肢厥冷,烦躁不安,冷汗淋漓,甚或昏厥,HCG阳性,血压下降,后穹隆穿刺或妇科B 超提示有盆腹腔内出血,脉细微欲绝或细数无力。此时首要解决出血问题,之后以补益气血为主,不可一味猛攻峻伐,以免损伤正气。
1.3.2.2正虚血瘀型
“正虚血瘀型”是指异位妊娠破损后,机体处于不稳定阶段,病机以气血两虚、瘀血内停为主。此时虽暂无伤阴亡血之虞,但仍随时有出血倾向。临床表现为异位妊娠破损后,腹痛拒按,或伴有阴道出血,时可扪及包块,HCG阳性,头晕神疲,舌质黯,脉细弦。治疗上因兼有正虚之象,故治疗上在杀胚化瘀的同时需兼扶正气,应避免攻过而伐正。如再次破损致血出不止、气血亏脱,则需手术治疗。
1.3.2.3瘀结成癥型
“瘀结成癥型”是指包块破损、瘀血久积、血溢于脉外成癥而成。临床上可表现为胚胎活性消失,滞于胞络胞脉日久,或已破损日久,胎元与瘀血互结成癥。症状表现为腹痛减轻或消失,触诊小腹或有局限性包块,HCG 弱阳性或阴性,舌质黯,脉弦细涩。因胎元已逝,治疗上以化瘀消癥为主,同时促进包块及盆腔瘀血的吸收,以防止盆腔粘连,以期减低再次异位妊娠的机率。
1.4 中医治疗及研究进展
基于异位妊娠血瘀或者气虚的病因病机,临床上中医治疗异位妊娠以活血化瘀、消癥杀胚为主要方法,中药汤剂多采用1958年山西医学院第一附属医院研制的宫外孕I号方,或者宫外孕II号方为基础,随证加减。也有学者提出以“桂枝茯苓丸”[10]、“活络效灵丹”[11]治疗,均以活血化瘀为法。
而邓高丕教授经过近十年的临床经验总结及研究,在输卵管妊娠辨病辨证的基础上,经过718例回顾性研究,150例前瞻性研究及796例回顾性评价,创立“输卵管妊娠病情影响因子评分”及“输卵管妊娠中西医结合治疗方案”[9]。具体方案如下:
表1 输卵管妊娠病情影响因子积分法
1分 2分 3分 |
停经周数(周) ≤6周 6~8周 ≥8周 腹痛程度无隐痛剧痛 血β-HCG ( IU /L ) <1000>3000 (超声) 盆腔内出血量最大直径( cm) <3>6 (超声)输卵管妊娠包块最大直径( cm) <3>5 |
表2 输卵管妊娠治疗方案表
辨证分型 | 治疗方案 | |
未 破 损 期
|
胎元阻络型 | 积分≤8分①当β-HCG<1000IU/L时,选择中药治疗。 ②当β-HCG≥1000 IU /L或输卵管妊娠包块最大径>125px 时,选择中西药结合治疗。 |
积分=9~10分选择中西药结合治疗。 积分≥11分时选择手术治疗。 | ||
胎瘀阻滞型 | 无论积分多少,选择中药治疗。 | |
已 破 损 期 | 气血亏脱型 | 无论积分多少, 都应及时手术治疗。 |
气虚血瘀型
| 积分≤9分①当β-HCG<1000IU/L时,选择中药治疗。 ②当β-HCG≥1000IU/L时,选择中西药结合治疗。 | |
积分≥10分,选择手术治疗。 | ||
瘀结成癥型 | 积分≤10 分, 选择中药治疗。 |
除了中药汤剂的应用,中医综合治疗治疗异位妊娠还包括:1、灌肠法:以复方毛冬青灌肠液保留灌肠,适用于气血亏脱之外的各种证型;2、外敷法:以双柏散外敷下腹以达活血化瘀,促进局部气血循行之效;3、中成药口服或静脉注射:血府逐瘀丸、大黄蟅虫丸、丹参注射液等;4、温针灸[12]:用以治疗HCG转阴后盆部包块的消退,具有良效。另外,也有学者关注中医在异位妊娠“治未病”当中的重要作用[13]。
综上所述,中医治疗异位妊娠具有创伤小,并且具有能最大限度地保留患者的生育功能等优点。
2 西医治疗异位妊娠
2.1 西医病因研究
西医认为异位妊娠发生机制尚不明确[14、15、16、17]认为异位妊娠的发病是多种因素作用的结果,也有一定的高危人群。具体病因如下:
2.1.1既往输卵管手术史
包括输卵管整形术、吻合术、结扎术和输卵管妊娠保守性手术,造成输卵管部分管腔狭窄或者输卵管周围粘连,输卵管的通畅度或蠕动功能受损,使异位妊娠的危险性增加。
2.1.2盆腔感染性疾病
陈秀芳[18]等人通过研究表明,在收集的病例中有近40%有盆腔炎史,具有盆腔炎史中,约36%的患者有人工流产史,认为人工流产后厌氧菌通过生殖道逆行感染输卵管,最终造成输卵管炎。而淋病奈瑟菌、沙眼衣原体是最常见的外源性致病菌,既往淋病、衣原体感染患者,异位妊娠较正常患者发病率高。如衣原体可导致严重的输卵管结构和蠕动功能的破坏,从而引起广泛粘连及瘢痕形成,最终影响受精卵在输卵管的正常运行[19]。在英国,沙眼衣原体被证明是引起盆腔炎性疾病的主要原因[20],进一步的研究证明规范地预防及治疗衣原体,不仅能降低沙眼衣原体的感染率,还能间接降低异位妊娠的发生率[21、22]。
2.1.3宫内节育器(IUD)的放置
1992年WHO进行的IUD与盆腔炎关系的前瞻性研究认为,长期放置IUD并不增加异位妊娠的发病率,还有报道认为IUD并不增加异位妊娠的发生率,也有学者认为IUD对异位妊娠的影响逐渐减小[23],近期临床观察认为[24],放置宫内节育环并不使异位妊娠率增高,放置宫内节育环避孕失败后异位妊娠发生率升高。仅释放孕酮的IUD可能与异位妊娠有关,孕激素可以抑制输卵管的蠕动频率及次数。
2.1.4辅助生育技术
随着辅助生育技术(ART)的发展,体外受精及胚胎移植的广泛开展,其导致的异位妊娠也引起人们的重视。据报道,辅助生育技术后发生异位妊娠的人群为2.1%-9.4%[25],其原因可能为:输卵管病变是不孕的主要原因,输卵管本身的病变如输卵管上皮受损,管腔狭窄等因素易导致胚胎滞留在功能不良的输卵管内着床和发育;ART技术可能将胚胎放置于输卵管开口,胚胎游走于输卵管内;胚胎放置过多也易导致异位妊娠的形成等。
2.1.5免疫因素
输卵管微环境的免疫因素尚未明确,但被认为在输卵管妊娠的胚胎种植输卵管中起关键作用,而蛋白组学的一个重要目标就是描绘和完善正常和疾病细胞转导通路的“线路图”[26、27]。输卵管微环境诱发输卵管妊娠的影响因素至关重要,文献研究[28]认为主要可以分成胚泡因素、胚泡在输卵管传输因素、输卵管微环境因素等三个诱发因素。
其中输卵管手术历史,盆腔感染是发生异位妊娠最明显的高危因素,除了以上论述的原因,还有多个性伴侣、盆腹腔手术史、吸烟、阴道冲洗、早年性交(<18岁)都被认为与异位妊娠的发病有关。
2.2 诊断
输卵管妊娠典型的症状为停经、阴道流血和腹痛,但仅有一半的患者有上述典型的三联征。对于早期不明位置的妊娠,由于症状不典型,诊断常常十分困难。临床上常用的西医诊断方法包括:
2.2.1病史及体格检查
腹痛是输卵管破裂的主要症状,并常伴腹腔内出血,疼痛的程度因人而异,疼痛的部位及性质也各有不同,有腹腔积血的患者会出现腹部疼痛放射至肩部,甚则昏厥或休克。体格检查在未破裂前常未见明显异常,生命体征平稳,腹部无或轻压痛,破裂后腹部压痛情况明显,宫颈饱满伴举摆痛,典型者妇检时有子宫“漂浮感”。
2.2.2hCG测定
受精卵着床后由绒毛滋养层的合体滋养细胞分泌的一种糖蛋白,正常妊娠在排卵后7-10天能测到β-HCG,最初3周内β-HCG分泌增加较快,在孕8-10周达高峰,持续1-2周后急剧下降,可特异性地检测妊娠。异位妊娠由于受精卵着床于子宫体腔外,血供较差,合成的hCG较正常妊娠减少,因此血清检测到hCG是滋养细胞存活的特征[29]。
2.2.3超声检测
盆腔B超检测在异位妊娠的诊断中其至关重要的作用。超声诊断准确率在97.3%左右[30]。腹部B超一般在6周左右可见到宫腔内孕囊,阴道彩超的临床应用可将时间提前约1周,提高了异位妊娠的超声诊断率。输卵管妊娠典型的B超表现为:当hCG>2000IU/L,阴道彩超未发现宫内孕囊,只见增厚子宫内膜,盆腔有或无积液,子宫旁一侧见边界不清,回声不均的混合性包块,有些病例可见胚芽或胎心,为超声诊断异位妊娠的直接证据。
2.2.4孕酮测定
对早孕妇女体内激素水平的测定可给临床提供重要信息[29],测定血中孕酮也是公认的协助诊断异位妊娠的方法之一[31]。有学者提出异位妊娠时血清孕酮值明显低于先兆流产和正常妊娠者,其敏感性和特异性均超过90%[32]。另有学者[33]研究表明,以异位妊娠血清孕酮49.1nmol/L为临界值,来区分宫内正常妊娠与异位妊娠,其诊断效率达94.5%。因此认为血清孕酮的测定不仅有助于早期发现异位妊娠,而且使异位妊娠的破裂率降低,最后有利于保留生育功能。
2.2.5诊断性刮宫
单靠诊断性刮宫异位妊娠有很大的局限性,在不能排除异位妊娠时,诊断性刮宫有辅助诊断的价值,如刮宫见到底蜕膜或绒毛则可证实宫内妊娠,如病理未见到绒毛或子宫内膜呈A-S反应则可能为异位妊娠[34]。
2.2.6腹腔镜探查术
腹腔镜探查术是诊断异位妊娠的金标准,诊断准确率高。对除了输卵管妊娠以外的特殊部位妊娠也可迅速进行诊断。但由于腹腔镜探查术是一种有创的操作,在异位妊娠的诊断中不作为首选的手段。
2.2.7穿刺术
包括:(1)后穹窿穿刺术:适用于有停经史且有腹痛,有或无阴道流血,见后穹窿饱满,疑有盆腹腔内出血,而无生育要求的患者。若抽出不凝血,则表明腹腔内有陈旧性或活动性的出血。但当无内出血或出血量较少时,子宫直肠窝凹陷有粘连或者血肿位置较高时有可能抽不到不凝血,但此时仍不能排除异位妊娠存在。(2)腹腔穿刺术:当内出血量较多时,腹部叩诊有移动性浊音,或伴膈肌刺激症时可经下腹部一侧穿刺,临床意义同后穹窿穿刺。
2.3西医治疗
随着异位妊娠早期诊断方法的增多及改进,发病人群的平均年龄降低,异位妊娠的治疗倾向于创伤少,尽量保留远期妊娠功能。目前的治疗方法如下:
2.3.1期待治疗
临床观察一些早期输卵管妊娠未经任何治疗,由于妊娠流产或胚胎停止发育,最终自身吸收或消失。Elson[35]通过研究发现,初次β-HCG<175U /L的患者治疗成功率为96%。此种方法需时较长,需密切随访,加之药物治疗的简便性,现临床上使用较少。
2.3.2药物治疗
药物治疗有简便,创伤小等优点,对于有生育要求,特别是有过一侧输卵管切除手术的患者,尤其适用。现临床上常用的药物治疗包括:甲氨蝶呤(MTX)和米非司酮。
2.3.2.1甲氨蝶呤
甲氨蝶呤是叶酸拮抗剂,是一种抗代谢类抗肿瘤药物,可抑制滋养细胞增殖,并导致胚胎死亡。国内目前异位妊娠多采用MTX单次肌肉注射治疗异位妊娠,剂量为1 mg/kg 或50 mg/m2,治疗期间每隔3天测定血清β-hCG,若血清β-hCG值下降幅度<15%或继续升高,应在第7天重复上述剂量治疗,直至观察血清β-hcg降至正常范围。另外,也可以局部直接注射在异位妊娠局部,在腹腔镜或b超引导下注射在病灶处,一次注射量为50-100mg。
2.3.2.2米非司酮
米非司酮是炔诺酮的衍生物,是一种孕激素拮抗剂,可作用于蜕膜,使蜕膜组织坏死;也可作用于下丘脑及垂体,导致LH水平下降,使卵巢黄体溶解;同时,也可直接作用于滋养细胞,使滋养细胞核固缩、空泡化。由于输卵管妊娠时孕激素受体缺乏,使用米非司酮治疗输卵管妊娠时必须加大剂量。Perdu[36]等人应用米非司酮结合甲氨蝶呤治疗异位妊娠可显著提高治愈率。
2.3.3手术治疗
异位妊娠的手术治疗是非常重要的治疗手段。根治性切除输卵管具有安全、有效、快捷等优点。其中腹腔镜手术由于其效果好,患者痛苦少等优点在临床上十分普遍。但考虑到手术的有创性损伤以及再次异位妊娠的结局可能性,在年轻、有生育要求的患者中,是否作为首选治疗方案,仍有待商榷。
3决策树在中医药领域的应用
3.1 决策树的基本概念及在医学领域的运用
决策树(Decision Tree)是一种主要解决实际应用中分类问题的数据挖掘方法。数据挖掘是近年来兴起的,由人工智能和数据库技术融合而成的学科[37]。决策树一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树[38]。其在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。通过对目标项目的多项影响因素分析,对目标类尝试进行最佳的分割。
作为一种应用十分广泛的数据挖掘方法,决策树在医学领域主要用于分类统计,例如根据起病急骤、发热、嗜睡、神志昏蒙等症状判断是否为缺血性中风的火热症[39]。在病情预后方面的预测,也有不少学者进行过有益的尝试。如马氏构建CART决策树预测糖尿病患者的死因[40],张氏构建CART决策树预测气管插管困难度[41]等等。
3.2决策树的类型
3.2.1ID3决策树
ID3决策树算法采用“信息增益”为度量来选择分裂属性,决策树分裂的基本原则是,数据集被分裂为若干子集后,要使每个子集中的数据尽可能的“纯”,也就是说子集中的记录要尽可能属于同一类别[42]。作为一种典型的决策树,ID3决策树明显的优点为构建速度快,能处理大量的数据集。但其缺点也十分显著,如只能处理离散属性,你能处理连续属性;不包括对树的修剪,无法进行优化。
3.2.2C4.5及C5.0决策树
C4.5决策树算法的核心思想与ID3决策树完全相同,但在实现方法上进行优化及改进。例如增加了交叉验证、对连续属性的处理、对样本属性值缺失情况的处理等。C5.0决策树则是C4.5决策树的优化版本[43]。
3.2.3CART决策树
CART(classification and regression tree)算法在1984年由美国加利福尼亚大学的Leo Breiman和斯坦福大学的Jerome H. Friedman提出,其应变量主要是二值分类变量,也可以是多分类、有序变量及连续型变量,自变量可以是离散变量,也可以是连续型变量。
在整体样本数据的基础上,生成一个层次多,叶节点多的大树,以充分反映数据之间的联系,然后对其进行删减,产生一系列子树,从中选择适当大小的树,用于对数据进行分类。假设样本空间T包含两类样本A类、B类,CART算法按照一定的规则对其进行分割,产生两个节点,即子集T1、T2,满足这个过程重复进行,直到按照每种标准,节点无法再分,成为最终叶节点。
通过比较以上4种决策树模型对变量属性的处理以及预测优势,马红霞[44]等人采取目前最常用的CART决策树模型进行CT诊断独立性肺结节的分类及预测。作为更加符合医学应用的决策树模型,本研究也将采取CART决策树进行模型构建。
3.3 决策树运用于预测异位妊娠病情预后的优势
决策树作为一种被证明准确有效的数据挖掘方法,能有效、快速地处理大样本量、多变量的数据,并且能生成决策树模型,结果简单、结构直观,易于理解,对于预测异位妊娠病情预后有其独有的优势。方俊群[45]等使用C5.0决策树法构建的出生缺陷预测模型,认为相比传统的判别分析,应用决策树法能够对出生缺陷的发生起到较好的预测作用。由此可知,在病情预测方面,决策树是一种理想的模型。
4 小结
综上所述,由于诊断异位妊娠的手段不断提高,使得异位妊娠早发现、早诊断、早治疗得以实现,使患者减轻痛苦,增加再次宫内妊娠结局的可能性。而在临床上,灵活配合运用各种中西医治疗方案,尤其是准确地预测患者预后,是临床医生的一致的奋斗目标。
第二部分 临床研究
1前期研究
导师组[46]通过对2006年至2009年在广州中医药大学第一附属医院妇科住院病人异位妊娠病例的收集统计分析,建立了贝叶斯函数方程,对早期不明位置妊娠进行预判,具体方程如下:
图1 早期位置不明妊娠贝叶斯函数方程
通过自身验证得出:该方程判别早期妊娠准确率为98.08%,判别早期异位妊娠的准确率为93.12%,总的有效率为95.6%;通过交叉验证得出:该方程判别早期妊娠准确率为97.44%,判别早期异位妊娠的准确率为90.48%,总的有效率为93.96%。随后,导师组[47]对该方程进行前瞻性研究,验证了此方程的临床意义、真实性及可靠性,最终将其开发为临床应用软件,如下图示:
在建立贝叶斯函数方程的过程中,宋阳通过以上判别方程以及Logistic回归分析,对异位妊娠病情影响因子筛选,最后得出12个有效变量,具体如下:
2 研究资料
2.1病例来源
本研究收集2011年至2013年在广州中医药大学第一附属医院妇科住院病人,入院后给予中药或中西医药物杀胚治疗的患者。
2.2纳入标准
①入院后使用早期不明位置妊娠判别公式规范化进行判别。
②最终诊断明确为异位妊娠(根据实用妇产科学及中华妇产科学诊断标准确定)。
③使用中药或中西医药物治疗。
④中药以导师邓高丕教授创制的宫外孕复方为主方加减,并最终出院诊断明确为异位妊娠。
以上需完全满足方能纳入。
2.3排除标准
①入院后直接手术。
②未明确诊断要求出院,最终无法追踪结果。
③具有全身系统严重疾病。
④不符合以上纳入标准。
2.4剔除标准
①数据收集不完整
②入组后发现不符合纳入标准
2.5异位妊娠诊断标准
①病史、临床症状:有停经史(个别无明显停经史),或有下腹疼痛,或有不规则阴道出血,或有肛门坠胀感,或有腰酸腰痛;
②妇科检查:子宫常大或略大,一侧附件或可触及包块,有压痛;
③妊娠试验阳性;
④盆腔B超:宫内未见孕囊,宫旁出现轮廓不清的液性或实性低回声区,或该区查有胚芽或原始心管搏动;或宫旁回声区无输卵管妊娠声像特征,腹腔内存在无回声暗区或直肠子宫窝处有积液;
⑤或可伴有腹腔移动性浊音或休克;
⑥或诊断性刮宫及病检未见妊娠组织;
⑦或手术探查发现输卵管妊娠病灶。
其中符合诊断标准①—④,参考诊断标准⑤—⑥,⑦为金标准。
2.6疗效评价标准
有效:腹痛、阴道流血症状消失,血、尿hCG降至阴性,B超下盆腔包块不增大或缩小,盆腔积液不增多或减少。
无效:腹痛、阴道流血症状加重,甚至出现失血性休克,血、尿hCG不降反升,B超下盆腔包块持续性增大,盆腔积液增加,最终转至手术治疗。
3 研究方法
3.1 研究对象
收集2011年至2013年在广州中医药大学第一附属医院妇科住院病人,出院诊断明确为异位妊娠的患者,符合纳入标准总共180例,其中数据收集不完整31例,予以剔除。最终收集病例数149例。
3.2 数据预处理
以SPSS 13.0录入数据,建立数据库并导入Clementine 12.0进行统计。由于Clementine 12.0无法进行中文数据处理,将12个变量予以赋值如下:
表3异位妊娠病情影响相关变量赋值
变量 | 转换名称 | 赋值 |
停经周数 | VAR0001, VAR0002(中医组) | 实际值 |
hCG值(IU/L) | VAR0002, VAR0003(中医组) | 实际值 |
盆腔包块 | VAR0003, VAR0004(中医组) | 0=无,1=有 |
宫内节育环 | VAR0004, VAR0005(中医组) | 0=无,1=有 |
盆腔炎史 | VAR0005, VAR0006(中医组) | 0=无,1=有 |
首次孕酮值 | VAR0006, VAR0007(中医组) | 实际值 |
有无阴道流血 | VAR0007, VAR0008(中医组) | 0=无,1=有 |
月经是否规律 | VAR0008, VAR0009(中医组) | 0=无,1=有 |
有无自然流产史 | VAR0009, VAR0010(中医组) | 0=无,1=有 |
有无异位妊娠史 | VAR0010, VAR0011(中医组) | 0=无,1=有 |
腹痛情况 | VAR0011, VAR0012(中医组) | 0=无,1=隐痛,3=剧痛 |
盆腔积液 | VAR0012, VAR0013(中医组) | 0=无,1=有 |
预后 | VAR0013, VAR0014(中医组) | 0=无效,1=有效 |
其中,下腹疼痛评价标准以数字评价量表(numerical rating scale, NRS),积分量化疼痛情况,以0分为无痛,以1-5分为隐痛,以6-10分为剧痛,具体如下:
3.3 统计方法
3.3.1决策树统计原理
决策树是一颗有向无环树,它由若干节点、分支、分裂谓词及类别组成。本研究以停经周数、血hCG值、有无盆腔包块、有无宫内节育器、有无盆腔炎史、首次孕酮值、有无阴道流血、月经是否规律、有无自然流产史、有无异位妊娠史、腹痛情况、有无盆腔积液等作为本次决策树的12个自变量,以药物治疗效果,即有无疗效作为因变量。具体方法如下:规定本次数据集为训练集D,以上12个自变量作为分裂属性,以“有无盆腔包块”为例,产生分裂谓词“有”及“无”,此分裂谓词是分裂父节点的具体依据。分裂后的所有训练子集被标记类标号为“有效”或“无效”。如下图示:
4 统计结果
以Clementine 12.0进行决策树算法运算,在数据收集过程中,由于出现少部分病例初次孕酮值丢失的情况,需将缺失值予以脱落,通过Clementine 12.0中“过滤缺失值”功能,从而完善数据,程序界面如下:
最后得出中药治疗组病例数总计81例,其中有效79例,无效2例;中西药治疗组病例数总计68例,其中有效62例,无效6例。
4.1 中西药治疗组决策树模型
4.1.1中西药治疗组重要变量的信息增益
从12个变量中筛选出中西药治疗组重要变量,得出血hCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史这5个变量信息增益最大,因此作为分裂属性,其余变量信息增益可忽略不计。
其中,5个变量的信息增益总共为1.0。显而易见的是,血hCG值、首次孕酮值在全部变量中占主导地位。
4.1.2中西药治疗组决策树模型
本次研究生成了树深为5,总生成7棵子树。计算得出:①当血hCG值>2449.39IU/L时,中西药治疗组无效均发生在停经周数>5.5周,存在盆腔包块及孕酮值<81.07nmol/l时。②当血hCG值<2449.39IU/L时,中西药治疗组无效发生在孕酮大于3.175nmol/l时;当39.245IU/L<血hCG值<2449.39IU/L时,中西药治疗组无效发生在孕酮小于3.175nmol/l时。总计68例,其中有效62例,无效6例,总有效率为为91.176%。③当血hCG值≤2449.39IU/L时,中西药治疗组成功率为96.552%,比更高血hCG值时明显提高。
图8 中西药治疗组决策树模型
4.2 中药治疗组决策树模型
4.2.1中药治疗组重要变量的信息增益
从12个变量中筛选出中药治疗组重要变量,得出血hCG值、首次孕酮值、腹痛情况、有无阴道流血这4个变量信息增益最大,因此作为分裂属性,其余变量信息增益可忽略不计。
表5 中药治疗组重要变量的信息增益
这4个变量的信息增益总共为1.0。与中西药治疗组一致的是,中药治疗组中血hCG值、首次孕酮值在全部变量中占主导地位。
4.2.2中药治疗组决策树模型
本次研究生成了树深为5,总生6棵子树。计算得出:总共14例中药治疗组无效发生在,当303.2IU/L<血hCG值<5043IU/L时。
5 小结
1、本次研究共收集了有效病例161例,治疗有效141例,治疗无效20例,总有效率94.63%。其中中药治疗组93例,有效79例,无效14例,有效率84.9%;中西药治疗组68例,有效62例,无效6例,有效率91.176%。
2、中西药治疗组得出5个重要变量,为血hCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史。这5个变量的信息增益分别为0.388、0.236、0.125、0.125、0.125。当血hCG值≤2449.39IU/L时,中西药治疗组成功率为96.552%,比更高血hCG值时明显提高。
3、中药治疗组得出4个重要变量,为血hCG值、首次孕酮值、腹痛情况、有无阴道流血。这4个变量的信息增益分别为0.43、0.289、0.141、0.141。
4、中药治疗组及中西药治疗组均发现,血hCG值及首次孕酮值对病情预后具有决定性预测力,其中血hCG值最为重要,同时,联合月经是否规律、有无阴道流血、有无自然流产史、腹痛情况等另外4个变量,可更加准确预测疾病预后。其余变量信息增益可忽略不计。
第三部分 分析与讨论
异位妊娠的诊断、治疗方案目前在临床上已十分成熟,特别是随着科教知识的普及,阴道彩超的普遍应用以及hCG定量测定的准确率提高,异位妊娠的早发现、早诊断、早治疗已成为现实。而判断疾病预后却没有一个统一的预测模型。以往临床上皆以朴素的认识观,根据临床医生的经验预测本病预后,本研究致力于构建一个决策树预测模型,通过对大样本量的病例进行收集、预处理,最后输出决策树模型,可以准确地预测出疾病的预后。同时,得出对疾病预后影响明显的变量,并计算出各自的信息增益,从而更好地对病情预后进行估计,对临床医务工作具有指导意义。
1 CART决策树在异位妊娠预后判断的应用
本研究构建的CART决策树是目前最常用的分类树方法,相对于神经网络算法等复杂的黑箱技术,它是一种相对简单的自动处理出局的机器学习方法,操作者只需进行简单的输入即可完成,易于运用,能有效、快速地处理大样本量、多变量的数据,最终形成的决策树模型简明易懂,便于在临床推广。在使用决策树过程中,临床医生只需要进行代入相关变量,即可得出异位妊娠预后结局。作为一种应用十分广泛的数据挖掘方法,在其他医学领域中,决策树模型同样发挥着重要的作用,在现今信息化的世界,通过数据挖掘方法,拟合大规模数据,进行信息整合,联合各学科优势,可为实现人工智能在医学的应用提供重要的方法学依据。
2 信息增益(Gain)在决策树自变量中的重要意义
在构建一个决策树的过程中,如何决定分裂属性至关重要,这也是其核心步骤。当数据集被分裂为若干子集后,我们希望形成的子集尽可能地“纯”,也就是说子集中的数据能尽量属于同一属性。因此,在这里要引用到“熵”的概念。“熵”是指数据集中不稳定性、突发性、随机性的集合。在形成的子集中,希望“熵”的值达到最小,在这个时候,Gain最大。在进行分裂时,决策树倾向于选择Gain最大的分裂属性进行分裂。唐氏等曾[48]提出以熵与加权和来确定取值的算法。本次研究发现,血hCG值、首次孕酮值、月经是否规律、腹痛情况、有无阴道流血、有无自然流产史这6个变量信息增益最大,因此作为分裂属性,其余变量信息增益可忽略不计。由此提示这6个变量在预测异位妊娠病情预后中最为重要。
3 hCG定量测定在异位妊娠药物治疗预后的重要性
在中西药治疗组中,血hCG值的Gain为0.388,中药治疗组中血hCG值的Gain为0.43。从这两组数据可以看出,血hCG值对判断病情预后最为重要。hCG是滋养细胞分泌的一种糖蛋白,作为胚胎活性判断指标,岳氏等[49]认为,hCG值越低,药物治疗异位妊娠的效果越显著。究其根本原因,可能与滋养细胞对输卵管各层组织的侵蚀力有关。而计算出一个判断疾病预后的hCG值分界点,则对临床有着举足轻重的指导作用。Klein M等人认为当hCG<2500 IU/L时,药物(甲氨蝶呤)治疗的成功几率较高[50]。而本研究发现,当血hCG值≤2449.39IU/L时,中西药治疗组成功率为96.552%,比更高血hCG值时明显提高。文献研究与与本研究结果相符合。
4 孕酮值在异位妊娠药物治疗预后的重要性
一般认为,孕酮值越低者,异位妊娠的手术风险越低[51]。由于在早期妊娠中,滋养细胞在输卵管中的生长活性不如正常宫内妊娠,导致黄体功能不全而生成的孕酮较低。因此,另有学者[33]研究表明,当血清孕酮<49.1nmol/L时,可做为临界值,初步判定为异位妊娠,由此来区分宫内正常妊娠与异位妊娠,其诊断效率达94.5%。因此认为血清孕酮的测定不仅有助于早期发现异位妊娠,而且使异位妊娠的破裂率降低,最后有利于保留生育功能。但是早期宫内妊娠结局不良的患者,血清孕酮值也同样可表现为低水平状态。因此在区别早期不明位置妊娠中,单靠血清孕酮值是无法准确判断妊娠位置的。
本研究发现,初次孕酮值在中药治疗组及中西药治疗组中的信息增益分别是0.289,0.236。由此说明,以孕酮值和hCG联合检测异位妊娠病情变化是确实可靠的手段。
综上所述,血hCG值及首次孕酮值对病情预后具有决定性预测力,其中血hCG值最为重要,因此以孕酮值和hCG联合检测异位妊娠病情变化信赖度较高。同时,联合月经是否规律、有无阴道流血、有无自然流产史、腹痛情况等另外4个变量,可更加准确预测疾病预后。其余变量信息增益可忽略不计。由此提示这6个变量在预测异位妊娠病情预后中最为重要。本次研究构建的决策树模型可以作为临床预测异位妊娠药物治疗预后的可靠模型。
第四部分 结 语
1 结论
本研究经过对文献研究,参考导师组宋阳建立的早期位置不明妊娠判别公式,筛选出的12个影响异位妊娠病情预后变量,共收集了有效病例149例,通过构建决策树预测模型,对药物组治疗异位妊娠预后进行预测。
1、本次研究共收集了有效病例161例,治疗有效141例,治疗无效20例,总有效率94.63%。其中中药治疗组93例,有效79例,无效14例,有效率84.9%;中西药治疗组68例,有效62例,无效6例,有效率91.176%。
2、中西药治疗组得出5个重要变量,为血hCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史。这5个变量的信息增益分别为0.388、0.236、0.125、0.125、0.125。当血hCG值≤2449.39IU/L时,中西药治疗组成功率为96.552%,比更高血hCG值时明显提高。
3、中药治疗组得出4个重要变量,为血hCG值、首次孕酮值、腹痛情况、有无阴道流血。这4个变量的信息增益分别为0.43、0.289、0.141、0.141。
4、中药治疗组及中西药治疗组均发现,血hCG值及首次孕酮值对病情预后具有决定性预测力,其中血hCG值最为重要,同时,联合月经是否规律、有无阴道流血、有无自然流产史、腹痛情况等另外4个变量,可更加准确预测疾病预后。其余变量信息增益可忽略不计。
2 创新点
通过构建决策树,对影响预后的因素中最主要的变量进行预测,对疾病的预后有着重要意义,以期更广泛地应用于临床,造福更多患者。
3 不足及展望
3.1 不足之处
收集的病例数深度及宽度应加深及拓宽,受制于研究时间不足,导致病例数不足及病例来源面窄,未行更大规模数据收集统计,在小样本量的条件讨论下,导致形成决策树模型的难度增加,可信度下降。
3.2 展望
1、CART决策树在统建树过程中可进行自我优化,即通过“修剪树枝”以及自我评估的方法生成一棵最优树,在方法学上已较为完善。如能进行大样本量多中心的研究,将提高该模型的可信度。
2、本研究表明在进行数据挖掘上,决策树模型具有简单、结构直观,易于理解的优点,为未来多学科信息化管理及优化提供了重要的方法学依据。
3、本研究确定了血清hCG值的预测临界点,但是对于孕酮值的预测临界点尚未得出有计意义的值,这有待于未来进一步的数据挖掘及实验室研究。
参考文献 略