使用基因型生物标志物和表型生物标志物来归类无临床症状血尿患者的制作方法
来源:知识产权百科 /
时间: 2025-03-15
本申请要求于2013年11月21日提交的、申请号为61/907,013的美国临时专利申请的优先权;发明人为DavidDarling、SatishKumar、MarkDalphin和PaulO'Sullivan。该临时申请通过引用完全并入本文中。
技术领域:
:本发明涉及检测没患有疾病的患者。具体地,本发明涉及使用遗传标志物(geneticmarker)和表型标志物(phenotypicmarker)来归类(triaging)患有血尿但没有癌症的患者。特别是,本发明涉及在归类肉眼可见血尿或显微可见血尿患者时对遗传标志物和表型标志物的分析。更特别地是,本发明涉及组合使用遗传标志物和表型标志物来归类无临床症状的肉眼可见或显微可见血尿患者以及预测患者的病情是否需要进一步的临床处理。
背景技术:
::癌症的早期治疗大大提高癌症患者的存活率。在膀胱癌的情况下,相比于病变转移患者5年6%的存活率,诊断为局限于原发部位疾病的患者5年的存活率为73%(Altekruse等人)。因此,膀胱癌早期和准确诊断的发展可以导致对患者的改善的预后。为协助癌症的早期检测,大量癌症特异性标志物已经得到确认。然而使用这些标志物会导致患有炎性膀胱疾病,但没有膀胱癌的患者的假阳性结果。无症状血尿(“AH”)是最常见的泌尿系统疾病的发现方式之一,根据人口数量其发病率在2%和30%之间(SchwartzG:Properevaluationofasymptomaticmicroscopichematuriaintheeraofevidence-basedmedicine-progressisbeingmade.MayoClinProc.2013,88(2);123-125;McDonaldM,SwagertyD,WetzelL:AssessmentofMicroscopichematuriainadults.AFP200673:10,GrossfieldG,WolfJ,LitwanM,HricakH,ShulerC,AgerterD等人.Asymptomaticmicroscopichematuriainadults:summaryofAUAbestpracticepolicyrecommendations.AFP2001:63:1145-54)。然而,AH表明泌尿系统恶性肿瘤发病率的病症在AH群体中的大范围为1.9-7%。对所有确诊AH患者进行的全面诊断工作对许多医疗保健系统是很大的负担。使用表型指标来分开高风险和低风险的患者已经在Loo等人一项最近的研究中被探索。(LooR,LiebermanS,SlezakJ,LandaH,MarianiA,NicolaisenG,AsperaAandJaconsenS:Stratifyingriskofurinarytractmalignanttumorsinpatientswithaymptomaticmicroscopichematuria.MayoClinProc.2013,88(2);129-138)。上述研究中有4414例呈现确诊AH的患者,该研究表明其中73%的患者没有查明的原因,而26%的患者需要某种形式的泌尿科病情检查以查明原因。约2.5%呈现AH的患者被诊断为有尿路上皮肿瘤,其它疾病例如尿路感染(UTI)(2.3%),肾结石(16.2%),前列腺出血(4%),和污染(0.4%)构成其他的诊断(Loo等人,同上)。技术实现要素:我们已经识别了该领域中的新问题,即如何辨别出无膀胱癌或有低膀胱癌风险但呈现血尿的患者。这解决了许多具有血尿但不是膀胱癌的患者可能经历并不需要的昂贵的和进一步侵入性的病情检查的问题。因此,本发明有用之处在于,当遗传信息和表型信息的组合提供辨别出无膀胱癌或有低膀胱癌风险的患者时,将这些个体从针对膀胱癌的全面病情检查的危险和费用中排除,并且本发明可以有效地将没患有癌症的患者从那些患有癌性疾病的患者,包括膀胱上皮癌,移行细胞癌(TCC)和非癌疾病的患者,包括炎性疾病中归类出来。本发明提出了解决新问题的新方法,因为该方法对诊断非癌症,而不是诊断癌症是出乎意料地有用的。使用遗传标准和表型标准的组合出乎意料地提供了比单独的遗传变量或表型变量更好的辨别力。数据从541次观察中得出,这些观察来自于用于内部验证的、使用自举程序的在CLIA标准和CURT+NorthShore下具有法律效力的产品试验。表型变量包括:(1)吸烟史、(2)血尿、(3)性别、和(4)年龄。遗传变量包括IGF、HOXA13、MDK、CDC、和IL8R的表达分析。遗传+表型模型(“G+P”)意外地表现得比单独的遗传变量或表型变量更好。肉眼可见血尿,或在尿液中发现可视觉识别的血液是膀胱癌患者中的普遍发现。对于那些患者,通常的标准做法是执行附加的诊断程序以诊断膀胱癌。然而,迅速地识别显微可见血尿患者并且理解显微可见血尿在尿路上皮癌方面的含义仍然是一个问题。在本文中,我们提供了改进的方法,用于确定如果呈现了肉眼可见血尿或显微可见血尿的患者患有膀胱癌的概率足够低,以保证不用进行额外的程序,那么这样的患者能否避免侵入性的和昂贵的进一步临床程序以检测尿路上皮癌(UC),包括膀胱癌。描述了归属于高概率尿路上皮癌(UC)的因素。除了环境因素例如吸烟史和职业暴露于芳香胺类之外,人口因素例如性别、种族和年龄明显有助于发展为UC的风险。基于这些因素进行医疗评估的患者的特性在特定的基础上常规使用。例如,广为接受的是呈现血尿的60岁有吸烟史的男性比呈现相同症状的35岁不吸烟的女性具有更高的UC阳性概率,然而尚未对这些差异对于患者患有UC的总概率的贡献进行定量。不同的基因型和表型因素赋予具体的权重并将这些与诊断测试结果组合可以显著增加非侵入性测试诊断能力的精度,并且在由临床和生物标志物的测试结果所限定的患者患有UC的概率基础上提供给临床医生更大的确定性来区分患者。尽管有一些可用于检测膀胱癌存在的方法,但是没有可靠和准确的方法以确定患者是否没有膀胱癌或患有膀胱癌的风险较低。为了解决这一需求,我们开发了新的分析方法,用于在呈现血尿(无论是肉眼可见血尿或显微可见血尿)患者中将癌症疾病和非癌疾病区别开。在本发明的一些方面中,我们将定量表型变量和定量遗传标志物表达进行组合,从而形成联合分离指数(“G+P指数”)以有效地从那些具有高概率UC的AH患者中归类出来具有低概率UC的AH患者。这种分离将那些不需要完整的泌尿病情检查的患者从那些确实需要完整病情检查的患者中做了界定,从而避免了对低概率UC患者进行不必要的病情检查。表型测定在G+P指数中被评价的表型变量包括血尿的频率(HFREQ)、年龄、性别、吸烟史、和红细胞计数(RBC)。这些术语在下文中进行定义。表型变量在本说明书中定义为包括临床发现和观察。基因型测定通常,由PacificEdgeLtd.开发的优选基因型测定包括遗传标志物CDC2、HOXA13、MDK和IGFBP5(“4标志物测定”)的表达的定量。在另一优选测定中,所述4个标志物和第5个标志物IL8R被定量(“5标志物”或测定;新西兰达尼丁的PacificEdgeLtd.的商标)(HolyoakeA,O'SullivanP,PollockR等人:DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes2008;14:742,以及O'SullivanP,SharplesK,DalphinM等人:AMultigeneUrineTestfortheDetectionandStratificationofBladderCancerinPatientsPresentingwithHematuria.JUrol2012,Vol.188No3;746),以及国际专利申请号PCT/NZ2011/000238,标题为“NovelMarkersforDetectionofBladderCancer”。这些出版物和专利申请中的每一个都通过引用完全包含在本说明书中,如同分别地通过引用包含在本说明书中。在优选的实施例中,4标志物测定可以在使用PCR扩增的未分级尿液上实施来定量4个mRNA标志物(CDC2、HOXA13、MDK和IGEBP5),其在尿路上皮癌中被过度表达。IL8R在嗜中性粒细胞被高度地过度表达,因此在非恶性炎性病症下被升高。包含该第5个mRNA标志物显著地降低了移行细胞癌(TCC)的假阳性检测的风险。从患者的角度来看,该测试是非侵入性的并且非常简单。取单一的尿液样本,往往是中段尿液但不排他,这往往在家中而不用进入诊所就可以完成。测定在呈现肉眼可见血尿患者中已表现为比细胞学更加敏感。最值得注意的是,测定对所有大于Ta阶段的尿路上皮癌达到100%(预先指定特异性为85%)的灵敏度,对所有高等级肿瘤的灵敏度为97%。测定归于单一分值,该分值将在患者尿液中体现的5个基因的定量基因表达结合起来。基于患者患有尿路上皮癌的概率,该分值将患者分开为三类。对于呈现血尿的患者(无论是肉眼可见血尿或显微可见血尿),本发明已经被证明通过加入在同一时间段内从患者收集的表型变量加强了这些基因型工具(无论是4标志物测定或测定),并且将这些组合成新的工具,可用于相对于患者患有尿路上皮癌(“UC”)的概率,将患者分开到三个定义的风险级别的指数。本发明的各方面本发明的各方面说明如下。可以理解的是,这些不是本发明的仅有的方面或实施例。普通技术人员可以将一个或多个方面结合在一起以产生另外的方面或实施例。一个方面包括用于确定呈现血尿的患者,或者患有尿路上皮癌的风险级别的方法,其包括:提供所述患者的尿液样本;定量一个值MI,包括定量在所述样本中的人类MDK、CDC2、HOXA13和IGFBP5的表达级别;评估所述患者的表型变量HFREQ、AgeGT、sex、SMK和RBC;根据下述公式中的任一个计算G+P指数:公式(i),G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8),或者公式(ii),G+P指数=(wl*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),或者G+P指数=-8.46+0.79IGF-1.60HOXA+2.10MDK+0.95CDC-0.38IL8R+0.98SNS+0.56Hfreq+1.11Gender+0.64Age;和确定G+P指数是否大于指示所述患者患有尿路上皮癌的风险级别的阈值。另外的方面包括另一个方面的方法,其中所述阈值选自G+P指数值为0至5、6至10、或11至15的组别,其中所述值0到5指示低风险,6至10指示中等风险,并且11至15指示高风险。其它方面包括任何其它方面的方法,其中,如果所述阈值是G+P指数值为6至10,那么所述患者要受到额外的临床测试或实验室测试。仍然进一步的方面包括任何现有方面的方法,其中,如果所述阈值是G+P指数值为11至15,那么所述患者要受到额外的临床测试或实验室测试。仍然进一步的方面包括任何其它方面的方法,其中,如果所述阈值是G+P指数值为0至5,那么所述患者被放在进一步临床测试或实验室测试的观察名单上。另外的方面包括任何其它方面的方法,其中所述阈值是用统计方法建立的。仍然进一步的方面包括任何其它方面的方法,其中所述统计方法是线性判别分析(LDA)、逻辑回归(LogReg)、支持向量机(SVM)、K-5最近邻(KN5N)和划分树分类器(TREE)中的任一项。另外的方面包括任何其它方面的方法,还包括定量选自图6或图7的一个额外的基因型标志物的表达。其它方面包括任何先前方面的方法,其中,定量基因表达的所述步骤通过检测mRNA水平来进行。其它方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测cDNA水平来进行。仍然进一步的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤使用与所述cDNA的至少一部分互补的寡核苷酸来进行。另外的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤使用利用正向引物和反向引物的qRT-PCR法来进行。仍然另外的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测蛋白水平来进行。仍然其它方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测肽的水平进行的。另外的方面包括任何其它方面的任一个的方法,其中,定量基因表达的所述步骤使用针对所述标志物的抗体来进行。仍然进一步另外的方面包括权利要求1至8或13至15的任一项的方法,其中,定量基因表达的所述步骤使用夹心型免疫测定方法,或使用抗体芯片来进行。仍然进一步的方面包括任何其它方面的任一个的方法,其中,所述定量基因表达使用单克隆抗体来进行。其他方面包括任何其他方面的任一个的方法,其中所述定量基因表达使用多克隆抗血清来进行。G+P指数上述表型变量和基因型变量根据以下关系组合成G+P指数:G+P指数=(w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),其中,HFREQ指的是在6个月周期内每个高倍视野下找到3个或更多红细胞的频率;如果频率低则HFREQ=0,并且如果每个高倍视野下超过3个红细胞则HFREQ=1。AgeGT50指受试者的年龄,如果大于50岁则AgeGT50=1,如果不到50岁则AgeGT50=0。性别男则Gender=1,性别女则Gender=0。SMK指的是受试者是否当前或以前是吸烟者;如果是非吸烟者则SMK=0,如果是吸烟者,则SMK=1。RBC指红细胞计数;如果为25或更多则RBC被设置为1,如果小于25,则RBC为0。MI是遗传标志物MDK、CDC、IGFBP5和HOXA13的表达的组合;如果M1大于4.5,则将其设置为1,如果小于4.5,则M1为0。IL-8指的是IL-8的RNA的表达水平;如果IL-8>2.5则IL-8被设置为1,如果小于2.5,则IL-8为0。符号“*”表示乘法运算符,加权因子w1-w7分别是分配给上面在G+P指数中列出的每个变量的权重。在其它优选的实施例中,(AgeGT50和RBC)可以从模型中去掉,如下所示:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)G+P指数的计算值在0至15之间。G+P指数值为11至15的患者被认为是膀胱癌“高风险”,并且指示了额外的膀胱癌病情检查的需求。G+P指数值为6至10的患者被认为是“中等风险”发展为膀胱癌,并且指示了需要额外的病情检查。G+P指数值为0至5的患者被认为是“低风险”发展为膀胱癌。“低风险”组的病人被放在观察等待名单上,如果额外的症状出现,或者显微可见血尿反复发生,则他们为可能的进一步病情检查被重新评估。如在示例3(图18和图19)中更充分地说明的,我们发现,单独的定量表型变量的ROC曲线生成适度水平的诊断能力。单独的定量基因型标志物的ROC曲线生成显著水平的诊断能力。当基因型变量和表型变量组合成G+P指数时,我们发现了出乎意料地更好的诊断能力。定量基因表达蛋白质或核酸(或者单独地或者彼此组合地)由细胞分泌或来自细胞分裂,或者通过细胞凋亡机制丧失,其具有作为血清或体液标志物来诊断疾病(包括膀胱的炎性疾病和/或膀胱癌)的功用,或者作为标志物监测确诊疾病的进展。蛋白质和细胞标志物的检测可以使用本领域中已知的方法来进行,并且包括使用RT-PCT,qRT-PCR,单克隆抗体,多克隆抗血清等。具体地,本发明提供了用于归类呈现血尿(无论是肉眼可见血尿或显微可见血尿)患者的方法,包括:(i)提供生物样本;(ii)检测所述样本中的一种或多种膀胱肿瘤标志物(BTM)。特别关注的膀胱肿瘤标志物包括MDK、CDC2、HOXA13和IGFBP5(“4标志物测定”)。可选地,也可以检测所述样本中的人类嗜中性粒细胞标志物白细胞介素8受体(IL8Rb)的水平(测定)。癌症的存在可以通过与正常患者、患有早期膀胱癌的患者、和/或患有炎性疾病的患者比较所述一个或多个BTM的水平来确认。例如,癌症的存在可通过对比BTM的表达和表达阈值来确认。阈值可以大约是表达水平至少是没患有癌症患者组的表达水平的1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9或10、100、1000或高达10,000倍。在其它方面,IL8Rb的高表达,但没有膀胱肿瘤标志物的改变的表达可以指示炎性疾病,而不是癌症。本发明的方法可以与用于检测膀胱癌的任何合适的标志物联合使用。用于本发明的合适的标志物的示例在图6或图7中概述。本发明包括使用在图6或图7中概述的标志物中的任何一个或多个。可选地,在其它优选的实施例中,本发明可以包括IL8Rb与标志物MDK、CDC2、HOXA13和IGFBP5的一个或多个的任意组合,该组合还可以与适合于检测膀胱癌的一个或多个其他标志物(例如,在图6或图7中概述的任何一个或多个标志物)组合。尤其是,本发明包括标志物的任何一种或多种组合的表达的定量,这些组合为:IL8Rb/MDK,IL8Rb/CDC2、IL8Rb/HOXA13、IL8Rb/IGFBP5,IL8Rb/MDK/CDC2、IL8Rb/MDK/HOXA13、IL8Rb/MDK/IGFBP5、IL8Rb/CDC2/HOXA13、IL8Rb/CDC2/IGFBP5、IL8Rb/HOXA13/IGFBP5、IL8Rb/MDK/CDC2/HOXA13、IL8Rb/MDK/CDC2/IGFBP5、IL8Rb/CDC2/HOXA13/IGFBP5、和IL8Rb/MDK/CDC2/HOXA13/IGFBP5。这些组合可选地包括适合于检测膀胱癌的一个或多个其他标志物,例如在图6或图7中概述的标志物中的任何一个或多个。本发明还提供了用于检测膀胱的炎性病症的方法,包括:(i)提供来自患者的生物样本;和(ii)检测所述样本中的人类嗜中性粒细胞标志物白细胞介素8受体(IL8Rb)的水平。膀胱的炎性病症的存在通过与正常患者、呈现血尿患者和患有炎性膀胱病症的患者的IL8Rb的水平进行比较来确认。例如,膀胱的炎性病症的存在可通过比较标志物IL8Rb的表达和阈值来确认。阈值可以大约是表达水平至少是另一组患者的表达水平的1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10、100、1000或高达10,000倍。本发明的优选的基因型方法可通过检测基因表达的任何合适的标志物来进行,例如利用任何合适的方法确定mRNA、cDNA、蛋白质或肽的水平。诊断的确认可以通过使用分类器系统来建立,例如线性判别分析(LDA)、逻辑回归(LogReg)、支持向量机(SVM)、K-5最近邻(KN5N),和划分树分类器(TREE)。附图说明本发明是参考其具体实施例,并且参照附图进行说明的,其中:图1描绘了IL8Rb的蛋白和mRNA序列(也称为CXCR2)。图2描绘了散点图,其示出IL8Rb对从非恶性疾病(前列腺疾病,膀胱炎,尿路感染和尿石症)中分开TCC的效果。IL8Rb已替代了图2c和图2f中的不同的膀胱癌RNA标志物。(a)MDK/IGFBP5;(b)MDK/HOXA13;(c)MDK/IL8Rb;(d)CDC2/IGFBP5;(e)CDC2/HOXA13;(f)CDC2/IL8Rb。图3描绘了ROC曲线分析(灵敏度VS特异性),其示出将IL8Rb包括在使用线性判别分析(LD)和线性回归(LR)导出的诊断算法中的效果。ROC曲线是从患有TCC和上尿路癌症的患者(n=61),和患有非恶性疾病膀胱炎、尿路感染和尿路结石的患者(n=61)导出的。(a)LD1(实线)和LD2(虚线)。(b)LR1(实线)和LR2(虚线)。IL8Rb被包括在LD2和LR2中。图4描绘了延长的ROC曲线分析,其示出将IL8Rb包括在使用线性判别分析(LD)和线性回归(LR)导出的诊断算法中的效果。该ROC曲线是从TCC患者(n=56)和,不同于图3,队列中的任何非恶性疾病患者(n=386)导出的。(a)LD1(实线)和LD2(虚线)。(b)LR1(实线)和LR2(虚线)。IL8Rb被包括在LD2和LR2中。图5描绘了箱形图,其示出非恶性泌尿疾病患者的尿中IL8RbmRNA的累积。RNA已经通过使用delta-Ct方法的qRT-PCR被定量(Holyoake等人,2008)。用此方法,较低的Ct反映较高的RNA水平。BPH:良性前列腺增生症;UTI:尿路感染;NSprostate:非特异性前列腺疾病;Vasc.Prostate:前列腺血管;warfarin:血尿继发于华法林的使用。对膀胱炎/UTI患者的观察是与所示的其它非恶性情况显著不同的(p=0.001)。图6描绘了已知在膀胱癌中被过度表达的标志物,并且该标志物是适合于在本发明中使用的。图7描绘了已知在膀胱癌中被低估表达的标志物,并且该标志物是适合于在本发明中使用的。图8描绘了实施例2的患者招募程序和数量的流程图。图9描绘了患病3个月患者的基线临床和人口统计特征。图10描绘了尿液测试的总体灵敏度和特异性。图11描绘了各种ROC曲线;图11a描绘了NMP22ELISA和uRNA-D的ROC曲线(测试包括四个标志物MDK+CDC2+IGFBP5+HOXA13);图11b描绘了五个标志物MDK、CDC2、HOXA13、IGFBP5和IL8Rb的ROC曲线。图12描绘了尿检对阶段、等级、肿瘤部位、肿瘤的多重性、血尿状态、尿液样本的肌酸酐和性别的敏感度。表格显示了TCC患者中尿检呈阳性的数目和百分比。图13描绘了尿检对诊断、肉眼可见血尿或肌酸酐和性别的特异性。表格显示了无TCC患者中尿检呈阴性的数目和百分比。图14描绘了采用五种不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)的下述标志物组合的ROC曲线:(a)MDK、(b)CDC、(c)IGFBP5、(d)HOXA13、(e)MDK+CDC2、(f)MDK+IGFBP5、(g)MDK+HOXA13、(h)CDC2+IGFBP5、(i)CDC+HOXA13、(j)IGF+HOXAI3、(k)MDK+CDC2+IGFBP5、(l)MDK+CDC2+HOXA13、(m)MDK+IGFBP5+HOXA13、(n)CDC2+IGFBP5+HOXA13、(o)MDK+CDC2+IGFBP5+HOXA13,加上或减去IL8Rb。图15描绘了灵敏度选择性研究的结果。图15a描绘了图14中ROC曲线的高达20%的假阳性率(80%的特异性)的“曲线下面积”(AUC),且图15b示出了源自于加入IL8Rb的AUC的差异。图16描绘了采用五种不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)、不同组特异性(a)80%,(b)85%,(c)90%,(d)95%,(e)98%的四个标志物MDK、CDC2、IGFBP5和HOXA13,加上或减去IL8Rb的组合的灵敏度的图表。图17描绘了在不同组特异性(a)80%,(b)85%,(c)90%,(d)95%,(e)98%增加IL8Rb时灵敏度的增益,并且在不同组特异性(f)80%,(g)85%,(h)90%,(i)95%,(j)98%增加IL8Rb时灵敏度的所得增益。图18描绘了用于测试使用单独的基因测试、单独的表型评价、和/或同时使用基因测试和表型评价来研究的具有血尿患者的ROC曲线。图19描述了本发明的变量,性别、吸烟史和HFREQNEW的比值比(横轴)的图表。图20A和图20B描绘了报告诊断准确性的标准的流程图。图20A描绘本研究中所有三个队列中肉眼可见血尿患者的流程图。图20B描绘了报告包括在本研究中的显微可见血尿患者的诊断准确性的流程图。图21描绘了代表三个分类模型的ROC曲线。P指数(点线),G指数(虚线)和G+P指数(实线)。图22描绘了根据每个模型NPV对血尿检测阴性的患者的比例。P指数(点线),G指数(虚线),和G+P指数(实线)。图23描绘了检测结果(横轴)对归类结果(纵轴)之间的关系的图表。图24描绘了G2指数(横轴)对G1+P指数(纵轴)的图表。具体实施方式定义在详细说明本发明的实施例之前,提供本说明书中所使用的一些术语的定义是有用的。术语“标志物”指与生物现象的存在定量地或定性地相关联的分子。“标志物”的示例包括多核苷酸,例如编码或非编码的基因或基因片段,编码或非编码的DNA或DNA片段、RNA或RNA片段;或基因产物,包括多肽,例如肽,寡肽,蛋白或蛋白片段;或与位于所述现象之下的机制直接地或间接地相关的任何相关的代谢产物,副产物,或任何其他识别分子,例如抗体或抗体片段。本发明的标志物包括如本文所公开的核苷酸序列(例如,基因库序列),特别是,全长序列,任何编码序列,任何片段,任何可能的探针(例如,跨越外显子—外显子边界创建的),其中包括捕获基序,发夹结构或荧光团,或其任何补充物,以及如上述所定义的任何可测量的标志物。如本说明书所用的“抗体”和类似术语是指免疫球蛋白分子和免疫球蛋白(Ig)分子的免疫活性部分,即含有与抗原特异性结合(免疫发生反应)的抗原结合位点的分子。这些包括,但不限于,多克隆、单克隆、嵌合、单链、Fc片段、Fab片段、Fab'片段和Fab2片段以及Fab表达库。抗体分子涉及IgG、IgM、IgA、IgE和IgD类中的任何一种,它们通过存在于分子中的重链的性质彼此不相同。这些也包括子类,例如IgG1、IgG2等等。轻链可以是kappa链或lambda链。本说明书中提及的抗体包括涉及所有类、子类和类型。还包括嵌合抗体,例如,特定于多个源的其单克隆抗体或其片段,例如,老鼠或人类序列。此外还包括骆驼抗体,鲨鱼抗体或纳米抗体。术语“癌症”和“癌的”指或描述哺乳动物的生理疾病,其特征典型地为异常或失调的细胞生长。例如,癌症和癌症病理可以与以下状况相关,例如,具有转移邻近细胞的正常功能,与邻近细胞的正常功能相干扰,细胞激素或其他分泌产物的释放水平异常,炎性或免疫反应的抑制或加重,瘤样病变,恶性肿瘤前照,恶性肿瘤,周围或远处组织或器官的侵入,例如淋巴结,等等。术语“肿瘤”是指所有肿瘤细胞生长和增殖,无论是恶性的或良性的,以及所有的癌前和癌变细胞和组织。术语“膀胱癌”是指产生于膀胱的肿瘤。这些肿瘤能够转移到任何器官。术语“BTM”或“膀胱肿瘤标志物”或“BTM家族成员”是指与尿路上皮癌、膀胱癌、膀胱移行细胞癌(TCC)、鳞状细胞癌和膀胱腺癌相关联的肿瘤标志物(TM)。术语BTM还包括单个标志物的组合,其组合提高了检测膀胱癌的敏感性和特异性。但是应当理解,术语BTM并不要求所述标志物仅对于膀胱肿瘤是特异性的。相反,BTM的表达可以在其它类型的细胞、患病细胞、肿瘤,包括恶性肿瘤中被改变。术语“低估表达BTM”是指标志物,其在膀胱肿瘤中展现的表达比在非恶性膀胱组织中低。术语“过度表达BTM”是指标志物,其在膀胱肿瘤中展现的表达比在非恶性膀胱组织中高。术语“差异表达的”,“差别表达”和类似的短语,指的是相对于其在控制受试者(例如对照样本)中的表达,其表达在患病(特别是癌症,例如黑色素瘤)的受试者(例如测试样本)中被激活至较高或较低的水平的基因标志物。该术语还包括其表达在相同疾病的不同阶段;在具有良好或不良的预后的疾病;或在有较高或较低水平的增殖的细胞中被激活至较高或较低的水平的标志物。差异表达的标志物可能在多核苷酸水平或多肽水平被激活或被抑制,或者可能受到选择性剪接以产生不同的多肽产物。例如,此类差异可以通过mRNA水平的变化、表面表达、分泌或多肽的其他分区来证明。差异表达可以包括两个或更多个标志物(例如,基因或其基因产物)之间的表达的对比;或两个或更多个标志物之间的表达的比例的对比(例如,基因或其基因产物);或在相同标志物的两种不同的加工产物(例如,转录物或多肽)之间的对比,该相同标志物在正常受试者和患病受试者之间;或在同一疾病的不同阶段之间;或在具有良好或不良预后的疾病之间;或在具有较高和较低水平的增殖的细胞之间;或在正常组织和病变组织(特别是癌症,或黑素瘤)之间的不同。差异表达包括例如正常和患病细胞,或已经历不同疾病事件或疾病阶段的细胞中,或具有不同程度增殖的细胞中的基因或其表达产物中的暂存的表达模式或细胞表达模式中定量及定性的差异。术语“表达”包括生成多核苷酸和多肽,特别是,由基因或基因的一部分生成RNA(例如,mRNA),并且包括生成由RNA或基因或基因的一部分编码的多肽,以及与表达相关联的可检测材料的出现。例如,从多肽—多肽相互作用,多肽—核苷酸相互作用,或类似物形成复合物,包括在术语“表达”的范围内。另一个示例是配基(例如杂交探针或抗体)与基因或其他多核苷酸或寡核苷酸、多肽或蛋白片段的结合,以及配基的可视化。因此,微阵列上、杂交印记(例如Northern印迹)上,或在免疫印迹(如Western印迹)上,或珠阵列上,或通过PCR分析的点的强度,包括在构成其基础的生物分子的术语“表达”内。术语“基因表达阈值”,和“限定的表达阈值”可互换使用并且是指所讨论的标志物的水平,在该水平外,多核苷酸或多肽的表达水平用作患者疾病的预测标志物。例如,高于某个阈值的IL8Rb的表达是诊断患者患有炎性病症的。使用膀胱癌标志物检测疑似膀胱癌患者时,也可以使用阈值。高于阈值的表达水平表示该患者患有炎性膀胱疾病,容易造成癌症的假阳性测试,而低于阈值的IL8Rb的表达水平预示该患者没患有炎性膀胱疾病。通过包含IL8Rb的测量,如果IL8Rb的水平低于阈值,那么来自膀胱肿瘤标志物的表达的任何结果都可被信赖(即阳性结果很可能对患有癌症的病人是阳性的,而不是实际上从发炎粘膜的非恶性细胞的剥落造成的膀胱癌标志物的水平增加)。术语“诊断阈值”指的是一个阈值,根据这个阈值,患者可以说已经被诊断患有或没患有指定的疾病,例如膀胱癌。诊断阈值根据多种因素,例如人口、患病率以及可能的临床结果,通常被设定为达到期望的灵敏度和特异性。通常,诊断阈值可以使用算法,和/或计算机化的数据分析来计算和/或确定。确切的阈值将取决于人口以及任何被用来预测疾病的模型(预测模型)。阈值是从如在下面示例中所述的临床研究中用试验方法确定的。取决于所使用的预测模型,表达阈值可以被设定为达到最大灵敏度,或针对最大特异性设定,或者针对最小误差(最大分类率)设定。例如较高的阈值可以被设定为达到最小误差,但是这可能会导致较低的灵敏度。因此,对于任何给定的预测模型,临床研究将被用于设定表达阈值,其通常达到最高灵敏度同时具有最小误差率。通常,该阈值可能大约是在…的表达(注:此处表达不完全,说明书第16页倒数第二段末尾)术语“灵敏度”指的是患有某种疾病的个体(由模型)测试为阳性的比例。因此,提高的灵敏度意味着更少的假阴性测试结果。术语“特异性”是指没患有某种疾病的个体(由模型)测试为阴性的比例。因此,提高的特异性意味着更少的假阳性测试结果。术语“接受者操作特性”(“ROC曲线”)指对于特定标志物或测试不同切断点的真阳性率(灵敏度)对假阳性率(特异性)的曲线图。ROC曲线上的每个点代表特定的灵敏度/特异性点,其将对应给定的阈值。ROC曲线对于建立阈值以得到所期望的结果是重要的。ROC曲线下的面积表示(表达为曲线下面积(AUC)分析,可以是给定的标志物或由多个标志物组成的测试如何的度量,其可以区分两个或更多诊断结果。ROC曲线也可以用来比较两个不同测试的准确性。术语“寡核苷酸”是指多核苷酸,通常是探针或引物,包括但不限于单链脱氧核糖核苷酸,单链或双链核糖核苷酸,RNA:DNA杂交体,和双链DNA。寡核苷酸,如单链DNA探针寡核苷酸,通常通过化学方法(例如使用可商购的自动寡核苷酸合成仪),或通过各种其他方法合成,包括体外表达系统,重组技术,以及在细胞和有机体中的表达。术语“过度表达”或“过度表达的”是指高于在正常组织中可见的患者的基因或标志物的表达水平。如果该表达是正常组织中或另一组患者的组织中的表达的1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,10,100,1000,或高达10,000倍,那么该表达可被认为是过度表达的。术语“多核苷酸”,在单数或复数使用时,一般是指任何多核糖核苷酸或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA。这包括,但不限于,单链和双链DNA,包括单链和双链区域的DNA,单链和双链RNA,和包括单链和双链区域的RNA,包含可以是单链或,更典型地,双链或包括单链和双链区域的DNA和RNA的杂交分子。还包括的是包含RNA或DNA或RNA和DNA两者的三链区域。特别包括的是mRNA,cDNA,和基因组DNA,和任何它们的片段。该术语包括含有一个或多个修饰的碱基,例如氚化碱基,或不寻常的碱基,如肌苷的DNA和RNA。本发明的多核苷酸可以包括编码或非编码序列,或者有义或反义序列。应当理解的是,在本说明书中每个引用“多核苷酸”或类似的术语,将包括全长序列以及其任何片段,衍生物或变体。术语“表型”是指在临床环境中,或在临床交谈中,或在病人的病史中可观察的特征。当用于计算G+P指数的公式中,“表型”或“P”是指患者的年龄,性别,血尿的发生率,和吸烟史。“多肽”,如在本说明书中所使用,是指寡肽,肽,或蛋白序列,或其片段;以及天然存在的,重组的,合成的或半合成的分子。当“多肽”在本说明书中列举以指天然存在的蛋白分子的氨基酸序列时,“多肽”和类似的术语并不意味着限制氨基酸序列为全长分子的完整天然氨基酸序列。应当理解的是,在本说明书中每个引用“多肽”或类似的术语,将包括全长序列,以及其任何片段,衍生物或变体。术语“qPCR”或“QPCR”是指例如在PCRTechnique:QuantitativePCR,J.W.Larrick,ed.,EatonPublishing,1997,和A-ZofQuantitativePCR,S.Bustin,ed.,IULPress,2004中描述的定量聚合酶链反应。术语“逆转录”是指一个过程,在其中,包括信使RNA(“mRNA”)的寡核糖核苷酸被用作使用酶(“逆转录酶”)的互补寡脱氧核糖核苷酸(“cDNA”)的生化合成的模板,该酶结合到模板RNA,并且催化一系列加成反应,该加成反应依次附接脱氧核苷酸碱基,以形成与RNA模板互补的寡脱氧核糖核苷酸链。术语“血尿”被定义为尿液中存在血液。它可以表现为尿液中的肉眼可见血尿(血细胞的可视痕迹),或显微可见血尿(血液的微观痕迹)。显微可见血尿的确认指示被定义为在至少3个妥善收集的尿样上每个显微镜高倍视野(HPF)下呈现3个或更多个血细胞。显微可见血尿也可以在诊所通过尿液试纸(比色对比估计)进行检测。血尿(显微的或肉眼的)可以无症状(没有伴有血尿的其他症状)或有症状。其他症状包括尿痛(排尿疼痛),膀胱排空不完全的感觉或增加的频率或排尿。杂交反应的“严格性”是本领域的普通技术人员容易确定的,并且通常是取决于探针长度,洗涤温度,和盐浓度的经验计算。通常,较长的探针需要较高的温度进行适当的退火,而较短的探针需要较低的温度。当互补链存在于低于其解链温度的环境中时,杂交通常取决于变性DNA重新退火的能力。所述探针和可杂交序列之间的预期同源性程度越高,可使用的相对温度越高。其结果是,随之而来的较高的相对温度将趋向于使反应条件更为严格,而较低温度将趋向于使反应条件较为不严格。额外的细节和杂交反应的严格性的解释可在例如Ausubel等人,CurrentProtocolsinMolecularBiology,WileyIntersciencePublishers,(1995)中找到。“严格条件”或“高严格条件”,如本说明书中所定义的,典型地:(1)采用低离子强度和高温用于洗涤。例如在50℃的0.015M氯化钠/0.0015M柠檬酸钠/0.1%十二烷基硫酸钠;(2)在杂交过程中采用变性剂,如甲酰胺,例如,50%(体积/体积)甲酰胺与0.1%牛血清白蛋白/0.1%细胞分层液/0.1%聚乙烯吡咯烷酮/50mM磷酸钠,pH值为6.5的缓冲液与在42℃的750mM氯化钠,75mM柠檬酸钠;或(3)采用50%甲酰胺,5XSSC(0.75M氯化钠,0.075M柠檬酸钠),50mM磷酸钠(pH值为6.8),0.1%焦磷酸钠,5X,邓波特溶液,超声处理的鲑鱼精子DNA(50ug/ml),0.1%SDS(十二烷基硫酸钠)和在42℃的10%硫酸葡聚糖,与在42℃的0.2XSSC(氯化钠/柠檬酸钠)和在55℃的50%甲酰胺中洗涤,随后用包括在55℃的含有EDTA(乙二胺四乙酸)的0.1XSSC(氯化钠/柠檬酸钠)中高严格性洗涤。“中等严格条件”可以被识别为如在Sambrook等人,MolecularCloning:ALaboratoryManual,NewYork:ColdSpringHarborPress,1989中所描述的,并且包括对比上文描述的,较为不严格地使用洗涤溶液和杂交条件(例如,温度,离子强度和%SDS(十二烷基硫酸钠))。中等严格条件的一个示例是于37℃在溶液中的过夜培养,溶液包括:20%甲酰胺,5XSSC(150mM氯化钠,15mM柠檬酸三钠),50mM磷酸钠(pH值为7.6),5X邓波特溶液,10%硫酸葡聚糖,和20mg/ml变性剪切的鲑鱼精子DNA,接着在约37-50℃的1XSSC(氯化钠/柠檬酸钠)中清洗过滤器。本领域技术人员将认识到如何根据需要调整温度,离子强度等以适应如探针长度等因素。术语“IL8Rb”是指嗜中性粒细胞标志物白介素8受体B(也称为趋化因子(C-X-C基序)受体2[CXCR2])(图1;序列号1和2),并且包括标志物IL8Rb。该术语包括多核苷酸,例如基因或基因片段,RNA或RNA片段;或基因产物,包括多肽,如肽,寡肽,蛋白或蛋白片段;或任何相关的代谢产物,副产物,或任何其他识别分子,如抗体或抗体片段。术语“可靠性”包括假阳性和/或假阴性的低发生率。因此,标志物的可靠性越高,与使用该标志物作出诊断相关联的假阳性和/或假阴性越少。“精度”是真实的结果(真阳性加真阴性)除以群体中的总病例数的比例,根据公式:术语“归类(triage)”是指从那些具有合理概率患有膀胱癌以及需要进一步的临床病情检查,包括膀胱镜检查或其他临床程序的血尿患者中区分出具有低概率患有膀胱癌的血尿患者。实施例因此,在某些优选的实施例中,提供了遗传标志物和表型标志物的组合,其允许从那些具有足够风险患有膀胱癌以授权进一步的临床病情检查,可能包括膀胱镜检查或其他程序的患者中区分出具有低概率患有膀胱癌的患者。在其他实施例中,提供了标志物,其有大于约70%的可靠性;在其他实施例中,大于约73%的可靠性,仍然在其他实施例中,大于约80%的可靠性,又在进一步的实施例中,大于约90%的可靠性,在还有一些实施例中,大于约95%的可靠性,又在进一步的实施例中,大于约98%的可靠性,以及在某些实施例中,约100%的可靠性。对于遗传分析,除非另有指明,本发明的实践将采用分子生物学(包括重组技术),微生物学,细胞生物学和生物化学的常规技术,这些技术是在本领域的技术范围内的。这些技术在以下文献中有充分解释,例如,MolecularCloning:ALaboratoryManual,2ndedition,Sambrook等人,1989;OligonucleotideSynthesis,MJGait,ed.,1984;AnimalCellCulture,R.I.Freshney,ed.,1987;MethodsinEnzymology,AcademicPress,Inc.;HandbookofExperimentalImmunology,4thedition,D.M.Weir&CC.Blackwell,eds.,BlackwellScienceInc.,1987;GeneTransferVectorsforMammalianCells,J.M.Miller&M.P.Calos,eds.,1987;CurrentProtocolsinMolecularBiology,F.M.Ausubel等人,eds.,1987;以及PCR:ThePolymeraseChainReaction,Mullis等人,eds.,1994。应当理解的是,上述术语可以指蛋白,DNA序列和/或RNA序列。也可以理解的是,上述术语也指具有如本说明书中所描述的同源序列的非人类蛋白质,DNA和/或RNA。本发明的实施例通常泌尿科医生所指的血尿患者预约在专门血尿门诊就诊。肉眼可见血尿的患者往往优先于那些显微可见血尿的患者。来自于初级保健提供者转诊时提供的信息可以是高度可变的,这使得依据患有尿路上皮癌的概率来精确分层患者是困难的。通常在患者就诊前,尿细胞学是常规地被要求的,并且如果为阳性,将增加患者接受完整的临床病情检查的优先权,但是虽然尿细胞学有时具有高度特异性,但是却具有非常低的敏感性,因此凭借其高假阴性率(6),具有很低的实用价值。没患有膀胱癌的血尿患者的表型和基因型分析G+P指数上述表型和基因型变量是根据以下关系组合成G+P指数的:G+P指数=(w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),其中,HFREQ代表在6个月周期内每个高倍视野下找到3个或更多个红细胞的频率;如果频率低,则HFREQ=0,并且如果每个高倍视野下超过3个红细胞,则HFREQ=1,AgeGT50是指受试者的年龄,如果大于50岁,则AgeGT50=1,如果不到50岁,那么AgeGT50=0。性别男性为1,性别女性为0。SMK指受试者是否当前或以前是吸烟者;如果为非吸烟者则SMK=0,如果为吸烟者,则SMK=1。RBC指红细胞计数;如果为25个或更多,则RBC设置为1,而如果小于25,则RBC为0。MI是遗传标志物MDK,CDC,IGFBP5和HOXA13的表达的组合;如果M1>4.5,则将其设置为1,如果小于4.5,则将其设置为0。IL-8指IL-8的RNA的表达水平;如果IL-8>2.5,则IL-8被设置为1,如果IL-8<2.5,则IL-8=0。符号“*”表示乘法运算符,并且加权因子w1—w7分别为分配给上面在G+P指数中列出的每个变量的权重。在其它优选的实施例中,(AgeGT50和RBC)可以从模型中去掉,如下所示:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)G+P指数的计算值在0至15之间。G+P指数值为11至15的患者被认为是膀胱癌“高风险”的,并且指出了额外的膀胱癌病情检查的需求。G+P指数值为6至10的患者被认为是“中等风险”发展为膀胱癌并且指示了需要额外的病情检查。G+P指数值为0至5的患者被认为是“低风险”发展为膀胱癌。“低风险”组的患者被放置在观察等待名单上,如果其他症状出现,或者如果显微可见血尿反复发生,则他们为可能的进一步病情检查被重新评估。对区分没患有和患有膀胱癌的患者有用的基因型变量包括RNA标志物“M1”的表达,“M1”是MDK,CDC,IGFBP5(IGBP5),和HOXA13的组合。另一个基因型变量是IL8R的RNA的表达。这些基因型变量的系数示于下面的表7中。4.5和2.5分别为M1和IL8R的阈值,并且分别分配了系数5和2。G+P指数的计算结果为0至15之间的一个值。G+P指数值为11至15被认为是膀胱癌“高风险”的,并且指出了额外的膀胱癌病情检查的需求。G+P指数值为6至10被认为是“中等风险”发展为膀胱癌并且指示了需要额外的病情检查。G+P指数值为0至5被认为是“低风险”发展为膀胱癌,并且这些患者被放置在等待名单上,如果其他症状出现,或者如果显微可见血尿反复发生,则他们为可能的全面病情检查被重新评估。如在示例3(图18和19)中更充分地描述的,我们发现,单独的表型数据的ROC曲线生成适度水平的诊断能力。单独的基因型数据的ROC曲线生成显著水平的诊断能力。当基因型数据和表型数据组合成G+P指数时,我们发现了出乎意料地更好的诊断能力。没患有膀胱癌的患者的遗传分析在一些优选的实施例中,本发明结合使用4标志物测定或测定(基因型变量)和五个主要风险因素(表型变量)中的一个或多个,以生成可用于归类显微可见血尿或肉眼可见血尿患者在患有尿路上皮癌的潜在风险方面的选择指数。虽然不排除灵活的膀胱镜检查的必要性,但基于表型变量和基因型变量被认定为具有尿路上皮癌高风险的患者可以更早就诊,可能全面改善患者的结果。基因型标志物可以作为工具用于检测无癌患者或选择患有疾病的低,中或高风险的患者组别。标志物可以,例如,在疾病组织和相应的非疾病组织之间差异表达。在这种情况下,差异表达的检测与疾病的存在相关联。可替代地,标志物可以直接与出现在疾病组织的变化,或疾病造成的变化相关联。炎性疾病与嗜中性粒细胞的增加相关联。已经发现的是,嗜中性粒细胞标志物白介素8受体B(IL8Rb;图1;序列号1和2),可以为样本中存在嗜中性粒细胞提供良好的标志物,并且因此可用作诊断标志物用于检测样本中的炎性疾病,特别是,检测炎性膀胱疾病。如图5所示,尿液中IL8Rb的累积指示炎性膀胱疾病的存在。具体而言,图5示出患有疾病的患者的尿液中IL8Rb的累积;良性前列腺增生,泌尿道感染,非特异性前列腺疾病,血管前列腺和继发于华法林的使用。然而,可以理解的是,IL8Rb的使用并不限于只检测这些疾病,但是这些示例表明,IL8Rb确实在患有膀胱炎性疾病的患者的样本中增加。也就是说,IL8Rb可以用作与膀胱疾病相关联的炎症的标志物,因此适合于用来检测与炎症相关联的任何疾病。因此,检测IL8Rb的量可以用作膀胱炎性疾病的标志物。更特别地是,IL8Rb可用于检测与嗜中性粒细胞的累积相关联的炎性膀胱疾病。对TCC的尿检很大程度上依赖于尿液中存在从脱落的肿瘤细胞获得的标志物。检测这些细胞的能力可以被大量的污染细胞,如血液和炎性细胞的存在所掩盖。此外,膀胱内膜的炎症可以导致非恶性细胞从黏膜脱落的增加。结果是,使用从膀胱移行细胞获得的标志物的尿检具有较高的可能性对取自患有膀胱炎,尿路感染或其他疾病导致的泌尿道炎症或移行细胞剥落,如尿路结石,的患者的尿样给出假阳性结果(Sanchez-Carbayo等人)。避免这样的假阳性结果的一种方式是选择在血液或炎症细胞中表达相对较低的标志物。使用这样的标志物的结果是在呈现非恶性,炎症性疾病的TCC患者中较少的假阳性。然而,在血液学来源的细胞中低表达的标志物未能弥补非恶性移行细胞脱落的增加率。已经被发现的是,来自发炎组织的所剥离的移行细胞对膀胱癌尿检精度的负面影响,可以通过改进泌尿道炎性病症患者的鉴定来最小化。这里,已经令人惊奇地发现,使用标志物IL8Rb与一种或多种膀胱肿瘤标志物(BTM’s)相结合提供了对于膀胱癌的更精确的检测。特别是,对于膀胱癌的基于标志物的检测,其包括标志物IL8Rb,是假阳性结果的可能性更低,这会导致患者患有炎性非癌病症的结果。一般来说,炎性病症存在或不存在由具有基因表达的阈值来确认,高于该阈值的IL8Rb的表达指示炎性病症。例如,IL8Rb的表达高于某个阈值是诊断患者患有炎性病症(见上文所描述的阈值)。当IL8Rb与预测膀胱癌存在的一个或多个标志物结合使用时,膀胱肿瘤标志物的升高的表达的存在和IL8Rb的表达高于某一阈值,可以预测患者患有炎性病症而不是癌症。此外,如果测试是对于患者的尿液进行的,那么该结果可以预测患者患有炎性膀胱疾病。膀胱肿瘤标志物的高水平最有可能是作为炎症结果的来自黏膜的非恶性细胞的结果。也就是说,患者虽然具有高水平的膀胱肿瘤标志物,但实际上没患有膀胱癌——即假阳性。可替代地,如果患者具有一种或多种膀胱肿瘤标志物的异常高水平或诊断水平,但是IL8Rb的水平低于阈值,则患者可能患有癌症,尤其是膀胱癌或尿路上皮癌。如果测试是对于来自患者的尿液进行的,则尤其是这样。这个结果对于健康服务提供者是显著有利的,因为他们可以肯定患者确实患有癌症,并且可以立即开始治疗,而不必担心该结果实际上是由给出假阳性结果的炎症疾病导致的。已经令人惊讶地表明,来自编码嗜中性粒细胞标志物白介素8受体B(IL8Rb)的基因的RNA的定量提高了使用公知的TCC或BTM标志物检测TCC患者的整体表现。IL8Rb的参考序列示出于图1和序列号1和2)。除了其在TCC检测中的作用,还探索了IL8Rb是否可以用作尿液标志物以帮助炎性疾病的诊断(图5)。使用IL8Rb标志物可以利用用于检测基因表达水平的已知方法,单独用于检测膀胱的炎性病症。用于检测基因表达的方法的示例概述如下。可替代地,IL8Rb可以与多个BTM中的一个相结合,以检测膀胱癌。已被示出,通过利用炎性疾病标志物IL8Rb作为测试膀胱癌的一部分,发炎组织对创建假阳性结果的影响被最小化。标志物IL8Rb可以与任何膀胱癌标志物联合使用,或者可替代地可以与两个或更多个标志物一起使用,作为特征的一部分,用于检测膀胱癌。减少假阳性结果的数量是指更少的没患有膀胱癌的患者经受可能不必要的程序,包括膀胱镜检查,该检查本身就有风险。减少假阴性结果的数量意味着膀胱癌患者更有可能被检测出,并因此对癌症进行进一步评估。IL8Rb改善膀胱癌检测结果的作用来自将患有非恶性疾病和膀胱癌的患者分开的能力。做到这一点,因为IL8Rb的增加指示样本中增加的嗜中性粒细胞的存在。因此,IL8Rb的能力不依赖于所使用的膀胱肿瘤标志物。如图2和图12至图15所示,当与多种膀胱肿瘤标志物和膀胱肿瘤标志物的组合相结合时,IL8Rb有增加标志物的能力的特异性的总体效果,以检测受试者的癌症。根据本发明的一个特征的示例是将IL8Rb与MDK,CDC2,IGFBP5和HOXA13结合使用,其也可以与适于检测膀胱癌的一个或多个其它标志物结合,例如图6或图7中列出的多个标志物中的任一项。如在图14和图15中所示,IL8Rb可以用在标志物的任意组合中,特别是组合IL8Rb/MDK,IL8Rb/CDC2,IL8Rb/HOXA13,IL8Rb/IGFBP5,IL8Rb/MDK/CDC2,IL8Rb/MDK/HOXA13,IL8Rb/MDK/IGFBP5,IL8Rb/CDC2/HOXA13,IL8Rb/CDC2/IGFBP5,IL8Rb/HOXA13/IGFBP5,IL8Rb/MDK/CDC2/HOXA13,IL8Rb/MDK/CDC2/IGFBP5,IL8Rb/CDC2/HOXA13/IGFBP5和IL8Rb/MDK/CDC2/HOXA13/IGFBP5。如图14和图15所示,IL8Rb的加入增加了标志物或标志物组合准确地诊断受试者的膀胱癌的能力。本发明不限定于这些特定的组合,但是可任选地包括适于检测膀胱癌的一种或多种其它标志物,例如图6或图7中列出的多个标志物中的任一项。下面表1显示了特异性标志物MDK,CDC2,IGFBP5和HOXA13和IL8Rb的标识。表1:膀胱肿瘤标志物的标识图2至图4和图12至图17示出了将IL8Rb与四个已知的有代表性的膀胱癌的标志物;MDK,CDC2,IGFBP5和HOXA13组合使用的效果。结果表明,通过组合使用,如果IL8Rb单独与每个标志物(图2,图14和图15至图17)组合使用,而且还有当与四个BTM标志物的所有可能组合一起用作特征时,将TCC患者的样本和那些非恶性疾病患者的样本区分开的能力得到了提高。如图10至图13所示,IL8Rb加入到四个标志物MDK,CDC2,IGFBP5和HOXA13(uRNA-D)中不仅相比单独的四个标志物增加了测试的整体表现,而且与其他已知的测试相比该测试也是非常有利的,其他已知的测试包括:埃利萨的“美国马萨诸塞州Matritech,Inc.的注册商标”,NMP22(美国马萨诸塞州Matritech,Inc.的注册商标),和细胞学。图14至图17也示出了IL8Rb在四个标志物MDK,CDC2,IGFBP5和HOXA13的各种组合中的效果。图14示出了使用五个不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)计算的四个标志物MDK,CDC2,IGFBP5和HOXA13加上和不加IL8Rb的所有组合的ROC曲线图。图15列表显示了所有5种分类器及4个生物标志物加上和不加IL8Rb的所有15种组合的曲线下面积(AUC)。此AUC计算被限制在假阳性率0至20%的面积,覆盖特异性的有效范围(80-100%)。AUC定量了图14的ROC曲线上的可见差异。图16示出了在具有和不具有IL8Rb时所测量的4个标志物的所有组合在特异性为(a)80%,(b)85%,(c)90%,(d)95%,和(e)98%的敏感性。图17列表显示了在固定特异性分别为(a,f)80%,(b,g)85%,(c,h)90%,(d,i)95%,和(e,j)98%时,灵敏度(ROC曲线上的垂直方向;较好的是“向上”)或特异性(ROC曲线上的水平方向;较好的是向左)的变化。这些结果表明,通常IL8Rb提高了生物标志物(MDK,CDC,IGFBP5和HOXA13),单独地或组合地,从正常的样本中分类出肿瘤的能力。这些结果通常表明IL8Rb能够增加测试能够检测出的膀胱癌或尿路上皮癌的精度。最大的收获是可看到标志物未加入IL8Rb则表现不好,或者分类器表现不好。较小的收获是可看到在加入IL8Rb之前标志物和/或分类器表现很好,因此其改进的空间较小。重要的是注意到,结果显示基于群体的分析以及当诊断个体患者,尤其是那些对BTM标志物的表达的诊断可能不清楚的患者,加入IL8Rb的益处可能更大。这些结果表明,IL8Rb不仅可以用于检测膀胱炎性疾病,在与标志物结合时还可以用于检测膀胱癌,导致减少“假阳性”结果减少引起的改进的膀胱癌检测。这些结果还表明IL8Rb的效用在于,其影响到各种标志物组合的整体表现,并且证实了IL8Rb改善一个或多个膀胱癌标志物精确检测患者中癌症的表现的能力。此外,图14和图15表明,使用一系列分类器模型可以实现相同的结果,以及表明该结果不依赖于分类器模型或算法,而是依赖于所用的标志物的组合。这些结果证实,任何适当的分类器模型或算法可以在本发明中使用。特别是,图14和图15表明,IL8Rb在较高特异性上的效果更大,特别是在临床上最适用的范围内。因此,使用本发明的G+P指数,我们能够基于表型变量和遗传变量准确地归类血尿患者到不同组:“高风险”组,患有尿路上皮癌组并且需要立即进一步的病情检查,“风险”组,并且需要立即的病情检查,“低风险”组,患者可以置于观察名单上,用于以后的评估。在身体样本中检测遗传标志物在若干优选的实施例中,对癌症的测定可期望在从血液,血浆,血清,例如使用腹腔冲洗液获得的腹膜液,或其它体液,例如尿,淋巴液,脑脊髓液,胃液或粪便样本上获得的样本上进行。对于检测膀胱的炎性病症或膀胱癌,理想地是,测试在尿样上进行。具体而言,用于检测炎性膀胱疾病或膀胱癌的本方法可以在来自身体的任何合适的样本上执行,该样本将指示尿液的,但是理想地是IL8RB的,以及任何直接从尿样中确认的其他癌症标志物的水平。检测可以对尿样直接进行,或者样本可以通过加入本领域中已知的任何合适的化合物或缓冲剂被稳定,从而稳定并防止样本中RNA和/或蛋白的分解,使得其可以在稍后进行分析,甚至确保在分析过程中RNA和/或蛋白是稳定的。确定受试者尿液中的蛋白和/或RNA水平可以直接对尿液进行,或者可以对尿液进行处理,以进一步纯化和/或浓缩RNA和/或蛋白质。用于提取和/或浓缩蛋白和/或RNA的许多方法在本领域中是众所周知的,并且可以在本发明中使用。可以理解的是,许多方法是本领域公知的用于确认特定基因的表达水平,RNA和/或蛋白的水平,并且可以在本发明中使用任何合适的方法。一些常用的方法概述如下,然而,本发明并不限于这些方法,并且用于定量蛋白和/或RNA水平的任何方法都是适用于本发明的。使用基因型标志物检测疾病和癌症的一般方法用于确定表达水平的一般方法概述如下,但是可以理解的是,用于确定表达水平的任何方法都是合适的。定量聚合酶链反应(qPCR)定量PCR(qPCR)可以使用特定的引物和探针对肿瘤样本,血清和血浆进行。在受控制的反应中,在PCR反应中形成的产物的量(Sambrook,J.,EFritsch,E.和TManiatis,MolecularCloning:ALaboratoryManual3rd.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(2001))与初始模板的量相关联。PCR产物的定量可以在反应物变得有限之前通过在对数期时停止PCR反应来进行。然后PCR产物在琼脂糖或聚丙烯酰胺凝胶中电泳,用溴化乙锭或类似的DNA染色剂染色,并且染色的强度通过光密度测定法测量。可替代地,PCR反应的进展可以使用PCR机器例如AppliedBiosystems’Prism7000TM(美国,康涅狄格州,AppleraCorporation的商标)或RocheLightCyclerTM(美国,加利福尼亚,RocheMolecularSystems,Inc.的商标)测量,其实时测量产物的积累。实时PCR测量DNA嵌入染料例如SybrGreen进入合成的PCR产物的荧光,或当猝灭剂分子裂解时报告物分子释放的荧光;报告物分子和猝灭剂分子被掺入到寡核苷酸探针中,该寡核苷酸探针杂交到在延伸自引物寡核苷酸的DNA链之后的目标DNA分子。寡核苷酸探针被在下个PCR循环中的Taq聚合酶的酶促作用移位并降解,从猝灭剂分子中释放报告物。在一个变型中,众所周知的Scorpion,该探针共价连接至引物。逆转录PCR(RT-PCR)RT-PCR可以用于比较不同样本群体,正常和肿瘤组织,有或没有药物治疗的RNA水平,以表征表达模式,在密切相关的RNA之间做区分,并且分析RNA结构。对于RT-PCR,第一步是从目标样本中分离RNA。初始材料典型地是分别从人类肿瘤或肿瘤细胞系,和相应的正常组织或细胞系中分离出的所有RNA。RNA可从各种样本中分离,例如来自乳房,肺,结肠(例如,大肠或小肠),结肠直肠,胃,食道,肛门,直肠,前列腺,脑,肝,肾,胰腺,脾脏,胸腺,睾丸,卵巢,子宫,膀胱等组织,原发性肿瘤或肿瘤细胞系的组织,以及来自健康供体的合并样本的肿瘤样本。如果RNA的来源是肿瘤,RNA可以从,例如,冷冻的或存档的石蜡包埋并且固定(例如,福尔马林固定的)的组织样本中提取。通过RT-PCR的基因表达分析的第一步是将RNA模板逆转录成cDNA,接着在PCR反应中其指数扩增。两种最常用的逆转录酶是禽成髓细胞瘤病毒逆转录酶(AMV-RT)和莫洛尼鼠白血病病毒逆转录酶逆转录步骤典型地依赖于不同的情况和表达谱的目的,使用特定的引物,随机六聚体,或寡-dT引物做指引。例如,提取的RNA可以按照制造商的说明使用RNAPCR试剂盒(美国,加利福尼亚,PerkinElmer)进行逆转录。然后获得的cDNA可以在随后的PCR反应中用作模板。尽管PCR步骤可以使用多种热稳定的依赖DNA的DNA聚合酶,但其通常采用TaqDNA聚合酶,其具有5'-3'核酸酶活性但缺乏3'-5'校对核酸内切酶活性。因此,qPCR(美国加利福尼亚州,RocheMolecularSystems,Inc.的注册商标)通常利用Taq或Tth聚合酶的5'核酸酶活性来水解结合到其目标扩增子的杂交探针,但是具有等效的5'核酸酶活性的任何酶都可以使用。两个寡核苷酸引物被用于产生PCR反应的典型特征的扩增子。第三个寡核苷酸或探针,被设计成用于检测位于两个PCR引物之间的核苷酸序列。探针是不可被TagDNA聚合酶延伸的,并用报告物荧光染料和猝灭剂荧光染料示踪。当两种染料在探针上的位置彼此靠近时,来自报告物染料的任何激光诱发的发射由猝灭剂染料淬灭。在扩增反应过程中,TaqDNA聚合酶以依赖模板的方式裂解探针。所得探针片段在溶液中解离,并且来自释放的报告物染料的信号是免于第二荧光团的淬灭效应的。报告物染料的一个分子被释放用于每个合成的新分子,并且非淬灭的报告物染料的检测为数据的定量解释提供基础。RT-PCR(美国,加利福尼亚州,RocheMolecularSystems,Inc.的注册商标)可以使用商售设备实施,例如,ABIPRISM7700TM序列检测系统(美国,康涅狄格,AppleraCorporation的商标)(美国,加利福尼亚州,福斯特城,Perkin-Elmer-AppliedBiosystems),或LightcyclerTM(美国,加利福尼亚州,RocheMolecularSystems,Inc的注册商标)(德国,曼海姆,RocheMolecularBiochemicals)。在优选的实施例中,5'核酸酶程序在实时定量PCR装置如ABIPRISM7700TM序列检测系统上运行。该系统由热循环仪,激光器,电荷耦合器件(CCD),摄像头和计算机组成。该系统以96孔格式放大热循环仪上的样本。在扩增过程中,激光诱导的荧光信号通过所有96孔的光纤电缆实时收集,并且在CCD处检测到。该系统包括运行仪器以及分析数据的软件。5'核酸酶测定数据最初表达为Cp,或循环阈值。如上所讨论的,荧光值在每个循环期间被记录并且代表产品的量扩增到扩增反应中的某一点。当荧光信号第一次被记录为统计显著时,该点就是循环阈值Cp。实时定量PCR(qRT-PCR)RT-PCR技术最近的变化是实时定量PCR,其通过双示踪的荧光生成试剂探针(即探针)测量PCR产物积累。实时PCR与定量竞争PCR和定量比较PCR均兼容,前者为每个目标序列的正常化使用内部竞争者,而后者使用包含在样本内的标准化基因,或RT-PCR的管家基因。进一步的细节由,例如,Held等人,GenomeResearch6:986-994(1996)提供。可以使用固定的石蜡包埋组织作为RNA源来确定表达水平。根据本发明的一个方面,PCR引物被设计为存在于要被扩增的基因中的侧翼内含子序列。在本实施例中,引物/探针设计的第一步是划定基因内的内含子序列。这可以通过公开可用软件来完成,例如由Kent,W.J.,GenomeRes.12(4):656-64(2002)开发的DNABLAT软件,或由BLAST软件及其演变。后续步骤按照完好建立的PCR引物和探针方法进行。为了避免非特异性信号,在设计引物和探针时,掩盖内含子内的重复序列是有用的。这可以通过使用贝勒医学院在线可用的重复掩蔽程序很容易实现,其对重复元素库掩藏DNA序列,并返回在其中重复元素被掩蔽的查询序列。然后可以使用任何商业上或其他公开可用的引物/探针设计包,例如PrimerExpress(AppliedBiosystems);MGBassay-by-design(AppliedBiosystems);Primer3(SteveRozenandHelenJ.Skaletsky(2000)Primer3ontheVIMNVforgeneralusersandforbiologistprogrammersin:KrawetzS,MisenerS(eds)BioinformaticsMethodsandProtocols:MethodsinMolecularBiology.HumanaPress,Totowa,NJ,pp365-386),掩蔽序列可用于设计引物和探针序列。PCR引物设计中需考虑的最重要因素包括引物长度,熔化温度(Tm),和G/C含量,特异性,互补引物序列,和3'末端序列。一般情况下,最佳的PCR引物通常是长度为1730的碱基,并含有约20-80%,例如,约50-60%G+C碱基。熔化温度在50至80℃之间,例如,约50至70℃通常是优选的。有关PCR引物和探针设计的进一步的指导方针请见,例如,Dieffenbach,C.W.等人,GeneralConceptsforPCRPrimerDesignin:PCRPrimer,ALaboratoryManual,ColdSpringHarborLaboratoryPress,NewYork,1995,pp.133-155;InnisandGelfand,OptimizationofPCRsin:PCRProtocols,AGuidetoMethodsandApplications,CRCPress,London,1994,pp.5-11;以及Plasterer,T.N.Primerselect:Primerandprobedesign.MethodsMol.Biol.70:520-527(1997),其整个公开都明确通过引用并入在本说明书中。微阵列分析差异表达也可以使用微阵列技术来识别,或者证实。因此,疾病特异性标志物的表达谱可以使用微阵列技术在新鲜或石蜡包埋的肿瘤组织中测定。在该方法中,所关注的多核苷酸序列(包括cDNA及寡核苷酸)在微芯片底物上铺排,或排列。然后排列的序列(即捕获探针)与来自所关注的(即,目标)细胞或组织的特定多核苷酸杂交。正如RT-PCR法,RNA的来源通常是分离自人类肿瘤或肿瘤细胞系的全部RNA,以及相应的正常组织或细胞系。因此RNA可以从多种原发性肿瘤或肿瘤细胞系中分离。如果RNA的来源是原发性肿瘤,那么RNA可以,例如,从冷冻或存档的福尔马林固定的石蜡包埋(FFPE)组织样本和固定的(如福尔马林固定的)组织样本中提取,在日常临床实践中,这些样本是常规制备和保存的。在微阵列技术的具体实施例中,cDNA克隆的PCR扩增嵌入物施加到底物上。底物可以包括最多1,2,5,10,15,20,25,30,35,40,45,50,或75个核苷酸序列。在其它方面,底物可以包括至少10,000个核苷酸序列。固定在微芯片上的微阵列序列,适合于在严格条件下的杂交。如其它实施例,微阵列的目标可以是至少长度为50,100,200,400,500,1000,或2000个碱基;或长度为50-100,100-200,100-500,100-1000,100-2000或500-5000个碱基。如其他实施例,微阵列的捕获探针可以是至少长度为10,15,20,25,50,75,80,或100个碱基;或长度为10-15,10-20,10-25,10-50,10-75,10-80,或20-80个碱基。荧光标记的cDNA探针可通过从所关注的组织中提取的RNA的逆转录掺入荧光核苷酸产生。施加到芯片的标记的cDNA探针具有特异性地杂交到阵列上的DNA的各点。经过严格洗涤以除去非特异性结合的探针后,该芯片通过激光共聚焦显微镜或另一种检测方法,例如CCD照相机,扫描。每个阵列单元的杂交定量允许评估相应的mRNA丰度。用双色荧光,由两个RNA来源产生的分别标记的cDNA探针成对杂交到阵列。因此对应于每个指定基因的两种来源的转录物的相对丰度被同时确定。杂交的小型化规模为大量基因提供对表达模式方便和快速的评价。此类方法已经显示出具有检测稀有转录所需的灵敏度,其在每个细胞中的几个拷贝上被表达,并且可再现地检测在表达水平上至少约两倍的差异(Schena等人,Proc.Natl.Acad.Sci.USA93(2):106-149(1996))。微阵列分析可按照生产商的协议,通过商售设备来进行,例如使用Affymetrix技术,Illumina微阵列技术或Incyte的微阵列技术。用于基因表达的大规模分析的微阵列方法的发展使得有可能系统地搜索多种肿瘤类型的癌症分类的分子标志物和结果预测。RNA分离,纯化和扩增mRNA提取的一般方法在本领域中是众所周知的,并且在分子生物学的标准教科书,包括Ausubel等人,CurrentProtocolsofMolecularBiology,JohnWileyandSons(1997)中公开。从石蜡包埋组织中提取RNA的方法公开在,例如,RuppandLocker,LabInvest.56:A67(1987),和DeSandres等人,BioTechniques18:42044(1995)。特别地,可以使用来自商家,例如Qiagen的纯化试剂盒,缓冲液组和蛋白酶,根据制造商的说明进行RNA分离。例如,来自体外培养的细胞的全部RNA可以用Qiagen“德国,希尔登,QiagenGmbH的注册商标”微型列被分离出来。其他商售的RNA分离试剂盒包括MasterPureTMCompleteDNAandRNAPurificationKit(EPICENTRE(D,Madison,WI),和ParaffinBlockRNAIsolationKit(Ambion,Inc.)。来自组织样本的全部RNA可以使用RNAStat-60(Tel-Test)进行分离。制备自肿瘤的RNA可,例如,通过氯化铯密度梯度离心被分离。使用固定的、石蜡包埋的组织作为RNA来源,包括mRNA分离,纯化,引物延伸和扩增用于分析基因表达的有代表性的协议的步骤在各种出版的期刊文章中给出(例如:T.E.Godfrey等人J.Molec.Diagnostics2:84-91(2000);K.Specht等人,Am.J.Pathol.158:419-29(2001))。简要地说,有代表性的过程开始于切割约10微米厚的石蜡包埋的肿瘤组织样本的切片。然后提取RNA,以及去除蛋白和DNA。在分析RNA浓度后,如果需要的话,可以包括RNA修复和/或扩增步骤,并且使用RT-PCR跟随的基因特异性启动子逆转录RNA。最后,分析数据,以在检查肿瘤样本中鉴别的特征基因表达模式的基础上确定对患者最佳的治疗选择。免疫组织化学技术和蛋白质组学免疫组织化学方法也适用于检测本发明的增殖标志物的表达水平。因此,抗体或抗血清,优选多克隆抗血清,及最优选的特定于每个标志物的单克隆抗体,用于检测表达。抗体可通过直接标记抗体本身被检测,例如,用放射性标记,荧光标记,半抗原标记例如生物素,或酶例如辣根过氧化物酶或碱性磷酸酶。可替代地,未标记的初级抗体与经标记的二次抗体(包括抗血清,多克隆抗血清或特异于初级抗体的单克隆抗体)结合使用。免疫组织化学协议和试剂盒在本领域中是众所周知的,并且是商售的。蛋白质组学可用于在某一时间点对存在于样本(例如,组织,有机体,或细胞培养物)中的多肽进行分析。特别是,蛋白质组技术可用于评估样本中多肽表达的全局变化(也称为表达蛋白质组学)。蛋白质组学分析典型地包括:(1)通过2-D聚丙烯酰胺凝胶电泳(2-DPAGE)分离样本中的单个多肽;(2)鉴定,例如,通过质谱法或N-末端测序法从凝胶中回收的单个多肽,和(3)使用生物信息学分析数据。蛋白质组学方法对于补充基因表达谱的其他方法是有价值的,并且可以单独地或与其他方法组合地用于检测本发明的增殖标志物的产物。使用为标志物选择的核酸探针的杂交方法这些方法涉及将核酸探针结合于载体,并且在合适的条件下与从测试样本获得的RNA或cDNA杂交(Sambrook,J.,EFritsch,E.andTManiatis,MolecularCloning:ALaboratoryManual3rdColdSpringHarborLaboratoryPress:ColdSpringHarbor(2001))。这些方法可以应用于来源于肿瘤组织或流体样本的标志物。所述RNA或cDNA标本通常用荧光或放射性分子标记,以使能检测和定量。在一些应用中,杂交的DNA可以用支链,荧光标记的结构进行标记,以提高信号强度(Nolte,F.S.,BranchedDNAsignalamplificationfordirectquantizationofnucleicacidsequencesinclinicalspecimens.Adv.Clin.Chem.33,201-35(1998))。在通过荧光检测或凝胶图像的光密度法定量杂交的量之前,未杂交的标记通过在低盐溶液如0.1xSSC,0.5%SDS中全面洗涤去除。该载体可以是固体,如尼龙或硝酸纤维素膜,或由在悬浮液体中时杂交的微球体或珠组成。为允许洗涤和纯化,珠子可以是磁性的(Haukanes,B-1andKvam,C.,Applicationofmagneticbeadsinbioassays.Bio/Technology11,60-63(1993))或荧光标记的,以能够使用流式细胞仪(例如参见:Spiro,A.,Lowe,M.andBrown,D.,ABead-BasedMethodforMultiplexedIdentificationandQuantitationofDNASequencesUsingFlowCytometry.Appl.Env.Micro.66,4258-4265(2000))。杂交技术的一个变种是QuantiGene测定(美国,加利福尼亚州,Panomics的注册商标)(Genospectra,Fremont),其结合了荧光珠载体和分支DNA信号扩增。杂交技术的另一个变种是mRNA测定(明尼阿波利斯,R&DSystem)。方法如制造商的使用说明中所描述的。简要地说,测定使用结合到地高辛的寡核苷酸杂交探针。在颜色测定法中,用连接到碱性磷酸酶的抗地高辛抗体检测杂交。其他方法在本领域是公知的,不需要在本说明书中进一步说明。酶联免疫吸附测定(ELISA)简言之,在夹心ELISA测定法中,针对标志物的多克隆或单克隆抗体结合到固体载体(Crowther,J.R.TheELISAguidebook.HumanaPress:NewJersey(2000);Harlow,E.andLane,D.,Usingantibodies:alaboratorymanual.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(1999))或悬浮液珠上。其他方法是本领域已知的,不需要在本说明书中进一步说明。单克隆抗体可以是衍生于或选自噬菌体抗体库的杂交瘤(HustM.andDubelS.,Phagedisplayvectorsfortheinvitrogenerationofhumanantibodyfragments.MethodsMolBiol.295:71-96(2005))。非特异性结合位点被非目标蛋白制剂和洗涤剂阻挡。然后,捕获抗体用来自带有抗原的患者的样本或组织的制剂培养。在抗体/抗原复合物用检测目标标志物的第二抗体培养之前,洗涤该混合物。所述第二抗体通常结合到荧光分子或其他报告物分子上,其可以在酶反应中被检测到或用结合到报告物的第三抗体检测到(Crowther,同上)。或者,在直接ELISA测定中,含有标志物的制剂可以结合到载体或珠,并直接用抗体—报告物结合物检测目标抗原(Crowther,同上)。用于制备单克隆抗体和多克隆抗血清的方法是本领域中是众所周知的,不需要在本说明书中进一步说明。免疫检测该方法也可以用于来自切除肿瘤术前和术后的膀胱癌患者的血清或血浆中标志物家族成员的免疫检测,其它癌症患者的标志物家族成员的免疫检测,包括但不限于,结肠直肠癌,胰癌,卵巢癌,黑色素瘤,肝癌,食道癌,胃癌,子宫内膜癌,和脑癌,以及来自膀胱癌患者的尿液和粪便中的标志物家族成员的免疫检测。也可使用其他标准免疫检测技术,例如免疫印迹法或免疫沉淀法(Harlow,E.andLane,D.,Usingantibodies:alaboratorymanual.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(1999))检测组织或样本中的疾病标志物。在免疫印迹法中,来自组织或含有标志物的液体的蛋白制剂,在变性或非变性条件下,通过聚丙烯酰胺凝胶被电泳。然后蛋白被转移到膜载体例如尼龙。如在免疫组织化学技术中所说明的,然后该标志物直接或间接地与单克隆或多克隆抗体反应。或者,在一些制剂中,蛋白可以直接点样到膜上,而不用事先电泳分离。信号可以用光密度法进行定量。在免疫沉淀法中,含有标志物的可溶性制剂在针对标志物的单克隆或多克隆抗体中培养。然后该反应用由带有共价连接的蛋白A或蛋白G的琼脂糖或聚丙烯酰胺制成的惰性珠来培养。蛋白A或蛋白G珠特别地与形成结合到珠的抗体—标志物—抗原的固定复合物的抗体相互作用。洗涤后,结合的标志物可以通过免疫印迹法或ELISA检测和定量。基于基因型分析建立诊断一旦已经获得IL8Rb和可选的一个或多个进一步的癌症标志物的表达水平,那么该受试者的诊断可以被建立。如果IL8Rb的表达是在没患有炎性膀胱疾病的受试者中可见的表达之上,和/或与已知患有炎性膀胱疾病的受试者的表达水平相一致,那么受试者将被诊断为患有炎性膀胱疾病。或者,如果IL8Rb的表达不是在没患有炎性膀胱疾病的受试者中可见的表达之上,和/或在已知患有炎性膀胱疾病的受试者的表达水平之下,那么受试者将被诊断为没患有炎性膀胱疾病。在IL8Rb与膀胱癌的一个或多个标志物结合使用的情况下,则IL8Rb的表达水平将与没患有炎性膀胱疾病的受试者,和/或已知患有炎性膀胱疾病的受试者的表达水平进行比较。该一个或多个癌症标志物与没患有膀胱癌的受试者和/或已知患有膀胱癌的受试者的表达水平进行比较。如果IL8Rb的表达水平与没患有炎性膀胱疾病的受试者一致(小于患有炎性膀胱疾病的受试者)并且一个或多个膀胱癌标志物的表达水平与患有膀胱癌的受试者一致(差别于没患有膀胱癌的受试者),那么受试者被诊断为患有膀胱癌。如果IL8Rb的表达水平比没患有炎性膀胱疾病的受试者高(与患有炎性膀胱疾病的受试者一致)并且所述一个或多个膀胱癌标志物的表达水平与患有膀胱癌的受试者一致(差别于没患有膀胱癌的受试者),那么受试者被诊断为具有炎性膀胱疾病。如果IL8Rb的表达水平与没患有炎性膀胱疾病的受试者一致(小于患有炎性膀胱疾病的受试者)并且所述一个或多个膀胱癌标志物的表达水平与没患有膀胱癌的受试者一致(差别于确实患有膀胱癌的受试者),那么受试者被诊断为既没患有膀胱癌也没患有炎性膀胱疾病。因为诊断用标志物的正常和疾病的表达之间经常有表达水平的重叠,为给受试者建立诊断,典型的是建立分类阈值。分类阈值是一个值或阈值,其区分受试者到疾病类别或非疾病类别中。通常使用接受者操作特性(ROC)曲线来评估阈值,其绘制对于所有可能的阈值的灵敏度对特异性。诊断阈值的确定对于使用疾病标志物的测试,可以得出诊断阈值,其使能样本被称为该疾病的阳性或阴性,例如,膀胱癌。这些诊断阈值通过分析进行了膀胱癌或炎性膀胱疾病的存在的调查的一批患者来确定。诊断阈值可以针对不同的测试应用而变化;例如,对于在群体筛查中使用测试的诊断阈值使用基本上没有泌尿症状的一批患者确定,并且这些诊断阈值可以不同于那些用在测试处于膀胱癌复发监视中的患者的阈值。诊断阈值可以被选择以提供在所需的临床环境中的实践水平的测试特异性;即,允许合理的灵敏度而没有数目过多的接收假阳性结果的患者的特异性。这种特异性可以是在80-100%的范围内。诊断阈值通过将每个标志物的基因型表达水平结合的算法应用到来自前瞻性临床试验的每个样本上来确定。使用的样本来自膀胱癌患者和一系列非恶性泌尿紊乱患者。诊断阈值通过确定导致所期望特异性的算法的得分来选择。例如,在一些应用中,85%的特异性是所期望的。然后诊断阈值通过选择导致85%的没有膀胱癌的患者被正确归类为癌症阴性的算法得分来设置。在其他应用中(例如群体筛查),倾向于更高的特异性,例如90%。为给此应用设置阈值,导致90%的没有膀胱癌的患者被正确归类为癌症阴性的算法得分被选择。使用算法的示例在示例中概述。作为单一阈值的替代,测试可以使用测试间隔,其提供不同程度的疾病存在的可能性,并且具有与它们相关联的不同的临床结果。例如,测试可能有三个间隔;一个与膀胱癌存在的高风险(例如90%)相关联,第二个与膀胱癌的低风险相关联,第三个视为疾病疑似。“疑似”间隔可以与建议在所界定的时间周期内做重复测试相关联。数据分析一旦完成测试RNA和/或蛋白的量的方法,则为了确定与肿瘤和非肿瘤样本相关联的生物标志物值的分布,必须分析数据。这通常包含正规化原始数据,即,去除背景“噪音”等并计算任何双重(或以上)数据的平均值,与标准比较,并且建立界点值或阈值以最佳分离两类样本。已知许多方法能做到这一点,并且确切方法将取决于所使用的确定RNA和/或蛋白的量的具体方法。下面是当使用qRT-PCR时,数据分析如何被实施的示例。然而,可以理解的是,一般过程可适应于用于建立RNA和/或蛋白含量的其它方法,或者其它方法可以通过本领域的技术人员来建立以实现相同的结果。数据荧光测量在PCR的每个循环的波长ωii=1,2上进行。因此,对于每个孔,我们观察到一对荧光曲线,由ft(ωi)表示,其中t=1,…,k表示循环数,并且i=1,2索引波长。荧光曲线有一个S形的形状,其开始于邻近的水平基线并且平滑地增加至上渐近线。荧光曲线与直线基线分开的点Cp的位置将被用于表征目标基因的浓度。Cp的准确定义如下。下面是处理这些数据的方案的示例。·补偿频段之间的荧光重叠,·为每个荧光曲线评估平滑模型以估算Cp·组合来自复制的孔的数据。·估算标准曲线·计算相对于标准的浓度。每个生物样本产生5个基因的相对浓度,它们是判别函数的输入数据。色彩补偿用Wtj(ω)表示在循环t与频率ω的染料j的荧光水平。在复用测定中,在任何频率ω的测量响应是在该频率的所有染料的贡献的总和,对于每个循环均是如此。ft(ω)=Wt1(ω)+Wt2(ω)+…色彩补偿的目的是从所观察到的混合物ft(ω)中提取个体贡献Wtj(ω)。在理想的情况下,由于在频率ω的染料j的荧光Wtj(ω0)与其在参考频率ω0的荧光Wtj(ω0)成比例,而不管Wtj(ω0)的水平。这表明对于某些待确定的比例常数A12和A21是线性关系。实际上有通过引入线性项到该系统中有效地建模的额外效果,所以尽管被线性基线扭曲,在估计“色彩补偿”参数A12和A21后,我们可以通过矩阵乘法恢复Wt1(ω1)和Wt2(ω2):Wt1(ω1)和Wt2(ω2)被称为“颜色补偿”数据。当评估低于2的色彩补偿数据的模型时,此表达式的最后一项的线性失真将被容纳在基准估算内。它对于Cp估算没有影响。色彩补偿系数的估算需要使用单一(与双重相对)探针的单独测定。则Wt2(ω2)=0,得出:因此,ft(ω2)=A21ft(ω1)+a*+b*t系数A21可以通过ft(ω2)关于ft(ω1)和PCR循环t,其中t=1,…,k的普通线性回归来估算。模型估计在这一部分中,让ytt=1,…,k表示色彩补偿的荧光曲线。扩增模型只是为荧光曲线而估计的,该荧光曲线显示不平凡的扩增。我们定义术语“扩增”为从色彩补偿的荧光曲线的线性基线的非平凡偏差。使用信噪比(SNR)来定量扩增。这里的SNR被定义为信号方差与噪声方差的比值。噪声方差设定为测定程序校准的一部分,并且保持不变:为此目的,使用来自对于没有扩增的孔,即没有RNA的孔的基线的线性模型的剩余方差,。对于每一个荧光曲线,估计信号方差作为来自最佳拟合直线的剩余方差(“最佳”是指在最小平方意义上)。·如果SNR低于指定的阈值,则荧光曲线接近线性和无扩增存在。然后没有从基线离开的点并且样本中的浓度可被定为零。·如果SNR高于阈值,则扩增存在并且浓度可以估算。选择(无量纲)SNR的阈值以提供“扩增”和“非扩增”曲线之间的明确区别。例如,阈值的以下范围是对标志物是有效的。模型为每个荧光曲线估计S形模型。模型的任何合适的参数形式都可以使用,但必须能够将以下特征模型化:·可以具有非零斜率的线性基线,·关于中点不对称。·在下部和上部水平的渐近线·从基线到上渐近线的平滑增加实现这些要求的模型的一个示例是我们称此为“6PL模型”。参数向量θ=[A,As,D,B,E,F]是受以下限制的,以确保gt(θ)为t的递增函数并且具有荧光曲线的实证性质。D>0,B>0,E<0,F<0其他两个参数确定基准线A+ASt,并且这些参数并不需要明确的约束,但是A始终为正并且坡度参数AS总是很小。参数D确定基线以上的扩增水平。剩余的参数B、E、F本身没有固有的解释而是控制曲线的形状。这些参数也是仅有的影响Cp的估算的参数。当AS=0,这是众所周知的5参数逻辑函数(5PL),如果,另外,F=1,这个模型降低为4参数逻辑模型(4PL),GottschalkandDunn(2005),Spiess等人(2008)。初始化对于非线性估计初始值设定为·AS=0,F=1·A=mean(y,…,y5)·D=range(y1,…,yk)·B=对应于半高的循环·E通过转换gt(θ)为线性形式进行初始化,该线性形式已设置其余参数的值为上述定义的它们的初始值。线性化获得现在,对于所选择的t,通过对回归估算E,使得导致(与其自身的初始化)几乎相同的分析的该模型的另一种形式是:当AS=0时,有时这被称为Richards方程,Richards(1959)。估算准则估算参数,以最小化惩罚平方和的准则:这里λ(θ)是惩罚θ中一些(或所有)参数的大值的非负函数。此方法被称为正则化回归或岭回归(Hoerl,1962),并且可以通过设置参数向量θ的合适的先验分布从贝叶斯观点导出。惩罚的满意选择是:λ(θ)=λ(B2+D2+E2+F2)大值的λ使参数估计值倾向于零,并降低了参数估计值的变化。相反,小的(或零)λ导致不稳定的参数估计值和最小化算法收敛困难。λ的选择是偏差和方差或稳定性之间的折衷。经验证据表明,如果λ在以下范围内选择,可以实现偏差和方差之间满意的折衷:0.01>λ>0.0001这个选择也保证了优化算法的收敛性。算法的选择对于λ在上述范围内的任何选择,在前面的段落中的描述完全定义了参数估计。基于传统的高斯-牛顿法(如在More中实现的Levenberg-Marquardt算法,1978)的非线性最小平方法已成功地被使用并且是合适的方法。优化算法的一般目的,例如NelderandMead,1965,或Byrd等实现的Broyden-Fletcher算法,1995)也已成功地在本说明书中被试验。Cp估计Cp是在时间t的点,其最大化了gt(θ)的二阶导数。每个荧光曲线产生一个Cp,其表征目标基因的浓度。每组技术复制的所估计的Cp的平均值被计算并在随后的分析中使用。标准曲线绝对浓度或相对浓度从与同一PCR板的标准曲线进行比较而得出。使用线性模型对稀释系列建模:Cp=R+Slog10Conc其中,Conc是该标准的绝对浓度或相对浓度。截距和斜率参数是针对具体板的。通过设置群体模型对截距和斜率参数中板之间的变异建模:其中,参数μR,μS,如下所述在现有数据的基础上设置。然后给定的板R和S可以被解释为来自这些群体的观察。对于在浓度Concj的标准的仿样i,以下模型可使用:Cp(i,j)=R+Slog10Concj+∈ij其中,需要注意的是残差的方差取决于Cp。Var(εij)的经验估计见表2。通过最大化似然函数估计参数R和S。通过以下表达式根据PCR过程的效率解释斜率参数:此模型有贝叶斯解释:给定参数μR,μS,模糊(无信息)的先验分布。然后R和S和Cp(i,j)的群体模型完全确定了现有数据的概率模型。马尔科夫链蒙特卡罗(MCMC)算法(Lunn等人,2009)允许对μR,μS,的估算。如果省略了先验分布,会得到传统的频率论解释结果。依照此估计程序,能够获得表3中的依赖基因的群体参数估计。表2:残差方差Cpσ2Cpσ2120.0100210.0466130.0108220.0625140.0119230.0860150.0134240.1212160.0155250.1750170.0184260.2591180.0224270.3931190.0279280.6112200.0356290.9741表3:标准曲线的斜率和截距的总体参数标准曲线的截距和斜率的估计由和表示。相对浓度ΔCp使用标准曲线由表达式来计算浓度ConcREF下的Cp(REF)。样本的相对浓度由以下表达式给出:或者,可在对应于PCR效率为2的固定水平来近似。则为任何一种选择使用相同的符号ΔCp。所得的ΔCp估计,每个基因一个,作为下一步中的判别函数的输入值。判别函数所述ΔCp值对应于去除板到板变化的相对生物标志物值。5个ΔCp值的彼此对照检查(例如,参见图2),显示了肿瘤样本通常是如何与肺肿瘤样本具有不同的生物标志物值的。此外,虽然肿瘤和正常组织有区域重叠,但是大量样本被有效分离。在这些情况下,许多不同的统计分类器可用于从肿瘤样本中分离出正常样本来。我们在这里展示了几个分类器的示范运行以分离这些样本。我们使用5种不同的分类方法:1)线性判别分析(LDA),2)逻辑回归(LogReg);3)支持向量机(SVM);4)基于5个近邻的K最近邻(KN5N);5)递归划分树(TREE)(引用:Venables&RipleyandDalgaard)。分类器的创建需要包含大量样本的生物标志物值的数据集,该数据集应代表由分类器测试的最终群体。例如,如果分类器是用于筛选高危人群的(如50岁和更老,吸烟者),则创建分类器所需的数据集(被称为“训练集”)应反映该群体并仅包含来自大于50岁的吸烟者的样本。通常,为得到像灵敏度和特异性这样的参数的误差小于10%的测量精度,训练集需要大于300个样本。分类器的有效性的估计可使用交叉验证进行。在交叉验证中(维基百科:交叉验证),数据集被划分成小数目的相等大小的分区(通常为3至10个)。一部分留出来,剩下的部分用来建立分类器;然后留出的部分由新的分类器测试并记录下它的预测。对每一个部分都依次这样做,并且所有的预测组合并进行分析,以计算出分类器的特征:灵敏度,特异性,等等。如果交叉验证是通过将数据划分成10份进行的,它被称为10倍交叉验证;同样地,3份将是3倍交叉验证。如果有多少样本数据就被分成多少份,那么这就是所谓的“留一交叉验证”。通过测试不用于构建分类器的数据,此方法提供了在不存在附加样本的情况下,对分类器性能的估计。我们已经使用4个生物标志物,MDK,IGFBP5,CDC2,和HOXA13,加上和不加生物标志物IL8Rb的所有15种组合,利用本说明书中其他部分描述的临床试验数据集(示例1)建立了分类器,并且用10倍交叉验证测试了这30个分类器。这针对上面列出的5个分类器类型的每一个完成并计算出ROC曲线。所有工作使用R统计编程环境(CITE)进行改善。这些结果(图14)表明,在大多数情况下,加上IL8Rb的分类器对诊断有用的特异性的值(假阳性率为0至20%;特异性为100至80%)更为敏感。诊断有用的特异性区域的曲线下面积(AUC)用于定量分类器如何与大的值良好运行的,其表示更好的分类器性能。图15a列表示出了每个分类器和生物标志物组合的AUC,而图15b示出了当加入IL8Rb时,每种条件下AUC的增加量。在大多数情况下,加入IL8Rb提高了做出准确诊断的能力。在图16中用表格列出了所有分类器的对诊断有用的特异性值的具体的灵敏度值。此外,图17以表格列出了加入IL8Rb后,灵敏度或特异性的增益量。分类器的效用被创建,当创建完分类器并对其测试完,它用来测试新的样本。为简化结果的解释,建立临界分数或阈值;在临界分数一侧的样本被认为是肿瘤阳性,而在另一侧的为肿瘤阴性。附加的临界分数可以建立,例如,以指示结果的确定性水平不断提高。在这种情况下,我们已经建立了临界分数,其在我们的训练集中给出了15%的假阳性率。使用我们的交叉验证过的ROC曲线,则我们可以估计我们的敏感性。通常情况下,发明人还在75%的阳性预测值处建立临界分数。为使用这些临界分数,我们为小于由85%的特异性建立的临界分数的分数建立了“阴性”结果。得分高于75%PPV的被称为“阳性”,得分在两者之间的被称为“不确定”或“疑似”。IL8Rb的抗体在另外的方面,本发明包括针对IL8Rb的抗体制造。标志物IL8Rb可以被足量制备以适合于引发免疫反应。在一些情况下,全长IL8Rb可以使用,而在其他情况下,IL8Rb的肽片段可以是足够作为免疫原的。免疫原可以注入合适的宿主(例如,小鼠,兔等),如果想要的话,免疫佐剂,如弗氏完全佐剂或弗氏不完全佐剂可以注射,以增加免疫反应。可以理解的是,制备抗体在免疫学领域中是常规的并且不需要在本说明书中进一步描述。其结果是,可以产生针对IL8Rb的抗体,包括单克隆抗体或噬菌体抗体。仍然在进一步的实施例中,抗体可以针对该蛋白或本说明书中确认的肿瘤标志物的蛋白核或IL8Rb独特的寡核苷酸序列制造。虽然某些蛋白可以被糖基化,但是糖基化模式的变化可以,在某些情况下,导致误检测缺乏寻常糖基化模式的IL8Rb的形式。因此,在本发明的某些方面,IL8Rb免疫原可以包括去糖基化IL8Rb或去糖基化IL8Rb片段。可以使用本领域中已知的一种或多种糖苷酶来实现去糖基化。可替代地,IL8RbcDNA可在糖基化缺陷型细胞系,例如原核细胞系,包括大肠杆菌等中表达。可制成在其中具有IL8Rb编码的寡核苷酸的表达载体。许多这样的载体可基于本领域中已知的标准载体。载体可用于转染各种细胞系,以产生IL8Rb-产生的细胞系,其可以被用于生产期望量的IL8Rb以发展特定抗体或其它检测IL8Rb的其他试剂或用于标准化已有的IL8Rb测定法的其他试剂。试剂盒基于本发明的发现,几种类型的检测试剂盒可以设想和制备。首先,可以制成具有预加载有检测分子(或“捕获试剂”)的检测装置的试剂盒。在检测IL8RbmRNA的实施例中,这种设备包括底物(例如,玻璃,硅,石英,金属等),在其上与待检测的mRNA杂交的作为捕获试剂的寡核苷酸被绑定。在一些实施例中,mRNA的直接检测可以通过将mRNA(用cy3,cy5,放射性或其它标记来标记)杂交到底物上的寡核苷酸来实现。在其他实施例中,mRNA的检测可以通过首先制备与所需的mRNA互补的DNA(cDNA)来完成。然后,标记的cDNA可以杂交到底物上的寡核苷酸,并被检测。抗体也可以在试剂盒中作为捕获试剂使用。在一些实施例中,底物(例如,多孔板)可以具有附接到其上的特定IL8Rb和BTM捕获试剂。在一些实施例中,试剂盒可包括封闭试剂。封闭试剂可用于减少非特异性结合。例如,非特异性的寡核苷酸的结合可使用来自不包含IL8Rb和BTM寡核苷酸的任何方便来源的过量的DNA被减少,例如鲑鱼精子DNA。非特异性抗体结合可以使用过量的阻断蛋白,例如血清白蛋白来降低。可以理解的是,用于检测寡核苷酸和蛋白的许多方法在本领域中是已知的,并且可使用可特定检测标志物相关联分子的任何策略并且其被认为落入本发明的范围内。当结合到固体载体上时,例如抗体芯片,其允许采用单个芯片检测多个标志物,也可以使用抗体。除了底物,测试试剂盒可以包含捕获试剂(如探针),洗涤溶液(例如,SSC,其它盐,缓冲剂,去污剂等),以及检测基团(例如,cy3,cy5,放射性标记等)。试剂盒还可以包括使用说明和包装。可以使用任何合适的技术来实施检测样本中的IL8Rb和BTM,并且可以包括,但不限于,寡核苷酸探针,qPCR或针对癌症标志物产生的抗体。应该理解的是,待测试的样本并不限于疑似为炎性疾病或肿瘤的组织样本。该标志物可被分泌到血清或其他体液中。因此,样本可以包括任何身体的样本,并且包括活检,血液,血清,腹腔冲洗液,脑脊髓液,尿液和粪便的样本。还应当理解,本发明不限于检测人类的癌症,还适用于检测任何动物的癌症,包括但不限于狗,猫,马,牛,羊,鹿,猪和已知患有癌症的任何其他动物。体液中炎性疾病或肿瘤标志物的常规测试一般而言,在这些体液中测定寡核苷酸,蛋白和肽的方法在本领域中是公知的。寡核苷酸的检测可以使用杂交的方法来进行,例如Northern印迹,Southern印迹或微阵列法,或qPCR。用于检测蛋白的方法包括如酶联免疫吸附测定(ELISA),具有抗体的蛋白芯片,悬浮珠粒放射免疫分析法(RIA),免疫印迹和凝集素结合。然而,为了说明的目的,疾病标志物的液体水平可以使用夹心型酶联免疫吸附测定(ELISA)定量。对于血浆测定法,适当稀释的样本的或连续稀释的标准标志物的5微升等分试样和75微升过氧化物酶抗人标志物抗体添加至微量滴定板的孔中。在30℃下30分钟培养时段后,这些孔用0.05%吐温20的磷酸盐缓冲盐水(PBS)冲洗,以除去未结合的抗体。然后标志物和抗标志物抗体的结合复合物在30℃下用含有H2O2的邻苯二胺培养15分钟。该反应通过加入1M硫酸终止,并且用微量滴定板读数器测量492nm处的吸光率。可以理解的是,抗IL8Rb抗体可以是单克隆抗体或多克隆抗血清。也可以理解的是,任何其他体液可以适当地进行研究。在生理意义上,被分泌的标志物不必要是有用的。相反,标志物蛋白或基因进入血清的任何机制,对生产所述可检测,可量化水平的标志物都是有效的。因此,细胞中的可溶性蛋白的正常分泌物,从质膜脱落的膜蛋白,以其形式表达的分泌的可变剪接形式的mRNA或蛋白,细胞死亡(或凋亡)可以产生足够水平的有用标志物。对于使用血清标志物作为工具来诊断和/或评估各种类型癌症的治疗功效的支持越来越多。示例本说明书中描述的示例是为了说明本发明实施例的目的。分析的其他实施例,方法和类型都在分子诊断领域的普通技术人员的范围之内,并不需要在此详细描述。本领域范围内的其他实施例被认为是本发明的一部分。示例1:膀胱癌的基因型分析方法患者:2008年4月至2009年9月期间,485例具有肉眼可见血尿,但没有尿路恶性肿瘤史的患者,在新西兰和澳大利亚的11个泌尿科诊所被招募。紧邻接受膀胱镜检查和任何附加的诊断程序前,每个患者提供一份尿样。进入研究三个月后,做出了诊断。这些485例患者中,使用下述方法成功地获得442例患者的所有五个研究基因的基因表达数据。这些患者的特征示于表4。表4:研究人群I的特点表4示出在患者初次出现显见血尿后的三个月时,每个主要诊断类别中患者的数量。尿液分析:尿样用中央审查细胞学检查(新西兰,达尼丁,SouthernCommunityLaboratories)进行分析。诊断测试NMP22(Matritech)和NMP22ELISA(Matritech)按照制造商的说明在临床现场或由SouthernCommunityLaboratories(NMP22ELISA)实行。RNA定量:每个患者的2mls或尿液用含5.64M异硫氰酸胍,0.5%十二烷基肌氨酸钠和50mMpH6.5醋酸钠的RNA提取缓冲液混合。然后,如前所述,所有RNA由Trizol萃取(Invitrogen)和RNeasy程序(Qiagen)提取。RNA从35ul水的柱中洗脱,并在每个后续单工或双工定量逆转录聚合酶链式反应(qRT-PCR)测定中使用3ul。每16ulqRT-PCR反应含有0.3URNAse-OUT(Invitrogen),0.225uM每个Taqman探针,1.25USuperscriptIII(Invitrogen),0.275uM每种引物,1.5UFastStartTaq聚合酶(Roche),10mMDTT,0.375mMdNTP,4.5mM硫酸镁,1.6ul10xFastStartPCR缓冲液(Roche)和2.6ulGCRich溶液(Roche)。针对五个研究基因MDK,CDC2,HOXA13,1GFBP5和IL8Rb中的每一个的引物和荧光双重标记的探针是从IntegratedDNATechnologies(美国,Coralville)获得的。引物/探针序列示于表2。反应设置在96孔板上并且在RocheLight480上做如下循环:50℃,15分钟;95℃,8分钟;95℃,15秒的10个循环,60℃,2分钟和95℃,15秒的30个循环,60℃,1分钟。参照RNA(从汇集的细胞系衍生的RNA)的1/16系列稀释的标准曲线包括在每块板上以产生0.3pg/μl至20ng/μl的范围。在最后30个热循环的扩展相位上收集数据并作为原始文本文件输出。下面的表5示出了用于五个RNA标志物的qRT-PCR定量的引物和探针序列。表5qRT-PCR数据分析原始荧光数据从Roche480导出为制表符分隔文件,其包含循环次数对板上所有孔的荧光数据的两个通道。该数据用施加色彩补偿([Bernard1999])到数据以校正从一个荧光通道渗色到另一个荧光通道的R程序进行处理。然后,它拟合了百分之五的逻辑模型以使用最大二阶导数法([Spiess2008])来估计Cp。所有样本和对照组复制地施加到PCR板上。复制孔中的Cp值在使用前取平均值。如果两个Cp值之间的差超过了3个单位,重复该样本。为提供跨越PCR板的标准化,Cp值表示为相对于20ng/μl参照RNA的ΔCp值(从汇集的细胞系衍生的RNA):ΔCp=Cp(样本)-Cp(参照RNA)统计分析MDK,CDC2,HOXA13,IGFBP5和IL8Rb的qRT-PCRΔCp值用于生成分类器,以基于线性判别分析或逻辑回归([Venables2002])分离含有TCC的样本和不含有TCC的样本。在这两种情况下,基因之间的相互作用在分类器模型中被允许。LDA的生成遵循标准程序,例如在"ModernAppliedStatisticswithS,4thedition"byW.N.VenablesandB.D.Ripley(2002),Springer中所述。任何不完整的数据被清理由研究而来的数据集,然后R统计环境(RDevelopmentCoreTeam(2009))和来自MASS包的函数“lda”(VenablesandRipley(2002))用于生成和测试临床试验数据的线性判别。逻辑回归分类器的生成以类似于生成LDA的方式实施。同样,不完整的数据被清理出研究数据。逻辑回归分类器使用R创建;不需要额外的软件包。逻辑回归依照如Dalgaard(2008)所述实施。分类器间的比较采用ROC曲线,使用R包,ROCR(Sing等人,2009)进行。使用Macskassy等人([Macskassy2005])的方法生成ROC曲线的置信区间。生成以下算法:线性判别分类器第一个分类器,线性判别,(称为LDA-3),是基于五个基因值(通过减去参考值归一化到参考值),其允许基因之间的多路相互作用。该分类器是使用从名为“MASS”包中的'lda()'函数内置在R中(Rversion2.9.1;MASSversion7.2-49)。该分类器是使用下面的方程式建立的:lda3<-lda(TCC.YN~MDK*IGF*CDC*HOXA*IL8R,data=uRNA.Trial)其中lda3是创建的模型;TCC.YN为由膀胱镜测定的“尿液中存在TCC”的真值(是或否);MDK,IGF,CDC,HOXA和IL8R是归一化的基因Cp值;uRNATrial是包含来自临床试验的5个基因和TCC.YN(是或否)中的每一个的Cp值的数据文件。公式中星号,'*',的使用表示乘法。分类器得分的估计过程为输入含有五个基因值以及分类器,lda3,的新数据帧,以输出分类器得分(score):Score<-c(predict(lda3,new.data)$x)其中,“score”是分类器用于预测TCC存在的输出;“lda3”是上面创建的分类器并且“new.data”是包含五个基因的测定值的数据文件,这五个基因用与在分类器创建中所用的相同的名字。该句法,`$x'和“c(...)”的存在是为了从由预测函数返回的大量信息中特定提取得分。设置得分的临界分数为0.112及以上,为尿样中存在TCCs设置我们的特异性为85%。LDA-3的系数示出在表6:表6逻辑回归分类器基于逻辑回归的第二个分类器来源于和LDA-3相同的清理过的数据集。然而代替使用lda()函数,我们使用统计包中的glm()函数(包括带有R的基础安装),如下所示:lr1<-glm(TCC.YN~CDC*IGF*HOXA*IL8R*MDK,family=binomial(“logit”),data=uRNA.Trial),其中,“lr1”是所创建的分类器,其它参数是如针对线性判别所描述的。再次,使用‘*’运算符指定全面互动。分类是以非常类似于对LDA-3的方式进行:score<-predict(lr1,new.data,type=′response′),其中,“score”是用于基于“new.data”中五个基因的测量值分类尿样的值,如上。lr1的临界分数被设定为0.102,以达到85%的特异性;临界分数的值被认为是TCC阳性。分类器的系数是:-103.0818143+3.9043769*CDC.d.R100+13.1120675*IGF.d.R100+17.4771819*HOXA.d.R100+-10.7711519*IL8R.d.R100+21.1027595*MDK.d.R100+-0.5938881*CDC.d.R100*IGF.d.R100+-1.0736184*CDC.d.R100*HOXA.d.R100+-1.3340189*IGF.d.R100*HOXA.d.R100+0.3126461*CDC.d.R100*IL8R.d.R100+1.4597355*IGF.d.R100*IL8R.d.R100+1.8739459*HOXA.d.R100*IL8R.d.R100+-1.035054*CDC.d.R100*MDK.d.R100+-2.5885156*IGF.d.R100*MDK.d.R100+-2.7013483*HOXA.d.R100*MDK.d.R100+1.4546134*IL8R.d.R100*MDK.d.R100+0.0767503*CDC.d.R100*IGF.d.R100*HOXA.d.R100+-0.0663361*CDC.d.R100*IGF.d.R100*IL8R.d.R100+-0.1015552*CDC.d.R100*HOXA.d.R100*IL8R.d.R100+-0.2110656*IGF.d.R100*HOXA.d.R100*IL8R.d.R100+0.1361215*CDC.d.R100*IGF.d.R100*MDK.d.R100+0.1601118*CDC.d.R100*HOXA.d.R100*MDK.d.R100+0.259745*IGF.d.R100*HOXA.d.R100*MDK.d.R100+-0.0106468*CDC.d.R100*IL8R.d.R100*MDK.d.R100+-0.1947899*IGF.d.R100*IL8R.d.R100*MDK.d.R100+-0.185286*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+0.0136603*CDC.d.R100*IGF.d.R100*HOXA.d.R100*IL8R.d.R100+-0.0151368*CDC.d.R100*IGF.d.R100*HOXA.d.R100*MDK.d.R100+0.0056651*CDC.d.R100*IGF.d.R100*IL8R.d.R100*MDK.d.R100+0.0030538*CDC.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+0.0232556*IGF.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+-0.000867*CDC.d.R100*IGF.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100结果尿样的qRT-PCR分析为获得IL8Rb对TCC检测的影响的综览,使用从患有TCC(n=56)或非恶性疾病尿石症(n=25),尿路感染(n=18)或膀胱炎(n=18)的患者的尿液获得的qRT-PCR数据,构建二维散点图。使用成对基因由四个基因标志物(MDK,CDC2,HOXA13,IGFBP5)构建散点图。然后IL8Rb代替每对中的一个基因,并且重新绘制数据。这些图在图2a-f中示出。在MDK散点图(图2a-c)中用IL8Rb代替IGFBP5和HOXA13示出了TCC患者和那些非恶性疾病患者的样本之间改进的分离。在CDC2散点图中用IL8Rb代替IGFBP5和HOXA13(图2d-f)观察到相同的趋势。然后IL8Rb对显见血尿患者的TCC正确诊断的贡献通过ROC曲线分析进行定量。标记物(MDK,CDC2,IGFBP5和HOXA13)和IL8Rb中的每个基因的qRT-PCR数据被用于开发线性判别算法,其将TCC患者和那些非TCC患者之间的判别最大化。使用整批442个样本:LD1,其使用来自MDK,CDC2,HOXA13和IGFBP5的qRT-PCR数据和LD2,其使用MDK,CDC2,HOXA13,IGFBP5和IL8Rb,来开发两个线性判别算法。然后LD1和LD2被用来生成ROC曲线,该曲线示出确诊患有TCC(n=56)或非恶性疾病尿石症(n=25),尿路感染(n=18)或膀胱炎(n=18)的患者组的TCC检测的灵敏度和特异性。图3a示出了LD1和LD2的ROC曲线。LD1的ROC曲线下的面积为78%,而LD2的ROC曲线下面积为84%。作为线性判别分析的替代,逻辑回归被用作独立的方法来开发用于判别TCC患者和那些非恶性疾病患者的算法。至于线性判别分析,逻辑回归算法采用整批442个样本开发。使用逻辑回归获得ROC曲线,上述56个TCC样本和61个非恶性样本示于图3b。LR1的ROC曲线下面积(使用来自MDK,CDC2,HOXA13和IGFBP5的qRT-PCR数据获得的)为80%,而LR2的ROC曲线下面积(使用来自MDK,CDC2,HOXA13,IGFBP5和IL8Rb的qRT-PCR数据获得的)为86%。该数据清楚地例示了将IL8Rb加入到利用尿样检测TCC的方法中可导致TCC患者和非恶性疾病,如膀胱炎,尿路感染和尿石症患者之间改善的判别。为确认由IL8Rb提供的、用于TCC患者和尿石症,尿路感染或膀胱炎患者之间的判别的改善的精度,这些患者被保持在一批未经选择的患者中,其包括更多的和更多样的非恶性患者,用表1中的整批442个样本重复ROC曲线分析。在此分析中,LD1和LD2的曲线下面积分别为86%和89%(图4a)。同样,LR1的曲线下面积为87%,LR2的曲线下面积为91%(图4b)。这个结果证实,IL8Rb导致使用尿样检测TCC中改善的精度。由于包含IL8Rb导致癌症检测中的此改善进一步通过在442个患者组中应用LD1/LD2和LR1/LR2进行例示,然后单独确定TCC的Ta阶段的检测的灵敏度。Ta阶段的肿瘤是更小、更分化的肿瘤,其通常比更高阶段的肿瘤更难检测。在85%特异性上,LD1检测到18/31(58%)的Ta肿瘤,而LD2检测到19/31(61%)的Ta肿瘤。LR1检测到21/31(68%),而LR2检测到24/31(77%)(85%特异性)。该数据表明,包含IL8Rb到LD和LR算法中提高了Ta阶段肿瘤的检测灵敏度高达9%。相比于这些RNA测试,这项研究中的其他三个膀胱癌试验示出了,检测Ta肿瘤的显著降低的精度:尿细胞学(39%灵敏度,94%特异性),NMP22ELISA(35%灵敏度,88%特异性)和NMP22(“美国,马萨诸塞州,Matritech,Inc.的注册商标”)(39%灵敏度,96%特异性)。IL8Rb作为尿道炎症诊断的辅助为了确定IL8Rb用于诊断由于如膀胱炎或尿路感染等原因患有尿道炎症的患者的能力,诊断为良性前列腺增生,非特异性前列腺病,血管性前列腺,继发于华法林使用的血尿,和膀胱炎/尿路感染的血尿患者的IL8RbmRNA尿液水平通过qRT-PCR确定。这些疾病中的每一个的平均IL8RbΔCt水平分别是-3.12,-3.10,-2.84,-1.98和-5.27。使用Wilcoxon秩和检验,确定患者膀胱炎/尿路感染和其它非恶性状态的组合病症的患者的IL8Rb水平的平均值之间的差异为显著(p=0.001)。描绘该数据的箱型图示于图5。该数据表明相比所检查的其他非恶性疾病的患者,IL8Rb水平在大多数诊断患有膀胱炎或尿路感染的患者中有升高。图表之间的重叠可能由三个因素的组合来解释:(ⅰ)标准临床实践无法正确地诊断每个疾病,(ⅱ)合并症(例如,感染和良性前列腺增生),和(iii)良性前列腺增生,非特异性前列腺疾病,血管前列腺或继发于华法林使用的血尿的患者子集中高尿嗜中性粒细胞计数的正常关联。无论如何,鉴于炎症和嗜中性粒细胞数之间的严格关联,尿液中IL8Rb的定量提供了检测尿路炎症的精确方法,无论是作为感染的后果或与其它非恶性疾病的关联。示例2方法研究群体在2008年4月28日至2009年8月11日之间在新西兰的9个泌尿外科诊所和澳大利亚的2个泌尿外科诊所,前瞻性地招募了一系列连续无TCC病史的患者。患者组包括示例1中所用的患者,但是还包括额外的46例患者,其数据没有用于第一个分析。进一步的研究还包括所获得的结果的进一步分析。样本的收集和RNA的收集和测试如示例1所述。RNA测试开发由四个mRNA标志物CDC2,HOXA13,MDK和IGFBP5组成。这些标志物是基于它们在血液和炎性细胞中的低表达以及在TCC中的过度表达被选择。在这个队列研究中,我们前瞻性指定线性判别算法(uRNA-D),其将四个标志物组合为单一的分数。uRNA-D是独立的,是在先前的数据集上开发出来的。然而,它不是使用代表测试针对的目标人口的严格特征患者组获得的。作为结果,该研究协议还定义了新的算法(分类器-D)的开发,用于使用从招募到当前队列研究的患者处获得的数据来使用五个标志物CDC2,HOXAI3,MDK,IGFBP5和IL8Rb。除了分类器-D,第二种算法(分类器-S)是使用队列研究数据获得的,以使能识别进展期(≥阶段1)或高度(WHO/ISUP1998年分类)的肿瘤。算法-S包括所有五个标志物,包括CDC2和HOXA13,其之前已经示出为在Ta阶段肿瘤和那些≥阶段1肿瘤之间被差异表达。分类器开发根据在本说明书中概述的方法,为使用五个标志物CDC2,HOXA13,MDK,IGFBP5和IL8RB开发两个分类器(分类器-D和分类器-S),是基于在本研究中获得的数据。简单地说,逻辑回归模型是使用统计编程环境R建立的(RDevelopmentCoreTeam(2011).R:Alanguageandenvironmentforstatisticalcomputing.RFoundationforStatisticalComputing,Vienna,Austria.ISBN3-900051-07-0,URLhttp://www.R-project.org/)。使用五个标志物的每一个的ΔCp值和它们的双向相互作用(例如,MDKxCDC2,MDKxIGFBP5等)建立的模型被评估其分类的能力;用留一法交叉验证程序估计具有最低AIC值的那些模型在特异度设为85%时的灵敏度。对分类器-D和分类器-S的每一个,几个模型展示了与选择最少数量的参数的模型相媲美的性能。统计方法诊断测试是在协议中规定的,为灵敏度和特异性计算出比例和95%置信区间。使用Stataroctab和roccomp命令(Statacorp和Delong)画出并比较接受者操作特性(ROC)曲线。对于分类器-D,置信区间不合适,但Fisher精确检验或卡方检验(当样本大小允许时)被用来测试TCC或患者的特性及真阳性或假阳性结果可能性之间的关联。逻辑回归模型用于探索与假阳性和假阴性结果相关的因素。所有分析均在Stata11.2版中实行。结果本研究最初共招募517例患者;,4%的患者被排除,因为发现他们是不合格的(n=10),没有经过膀胱镜检查的(n=9),TCC状态不合规定(n=2),或者他们没有提供可接受的尿样(n=2)(图8)。另外10例患者从分析中排除,因为他们没有一个或多个尿测试的结果。剩余的485例患者的基线人口统计学和临床特征示于图9。队列中TCC的患病率为13.6%。两例错过复查阶段(两例都是当地复查为Ta),两例都没有给定复查级别(一例为当地病理学家诊断1级,另一例为低级)。66例肿瘤中,55例是浅表的(Ta,T1或Tis阶段),11例为肌层浸润性(T2)。没有患者具有可检出的区域淋巴结转移或加入。使用1973分级系统,24例被分类为3级,38例为2级,3例为1级和1例未知。使用WHO98系统,29例被分类为高级,4例混合,32例低级和1例未知。除了TCC,两例患者被诊断为乳头状瘤,七例诊断为其他肿瘤(其中五例是泌尿外科的)。uRNA-D测试的临界值是在特异性设定在85%的研究队列上确定的。根据此临界值,相比于NMP22TMELISA(50%),(38%)和细胞学(56%),uRNA-D检测到66个TCC病例中的41个(62%灵敏度)。在队列数据分类器-D上开发的RNA测试在85%的特异性检测到TCC病例中的54个(82%),在90%的特异性检测到48个(73%)。uRNA-D和NMP22TMELISA值可以直接比较,因为这两个测试在本研究之前得到充分说明。图21示出ROC曲线;曲线下面积(AUC)分别为0.81和0.73(p=0.03)。分类器-D的ROC曲线为0.87(图21),并相对于uRNA-D的性能改善似乎主要是在临床上相关的特异性范围内(80%以上)。总体上,分类器-D检测出的高级/3级肿瘤的97%,相比于uRNA-D(83%),细胞学(83%),NMP22ELISA(69%)和(38%)。相比于其他测试的范围为28-41%(图12),分类器-D也对检测低级肿瘤(69%)更灵敏。分类器-D对所有阶段≥1加两个Tis的TCC病例为阳性,但是对Ta阶段灵敏度为68%(p=0.016,图12)。这仍然大大高于其他测试,uRNA-D是第二高的,为41%。相比那些没有肉眼可见血尿或显微可见血尿(p<0.0005)的TCC患者,尿样中明显具有肉眼可见血尿或显微可见血尿的TCC患者更可能通过加入IL8Rb检测到其TCC,尽管这可能至少部分是肉眼可见血尿或显微可见血尿患者中高阶段和高级TCC的比例较高的结果。数目不足以在回归分析中做进一步探讨。分类器-D错过的12个病例中,所有均为Ta阶段的,并且除了1个外,其余均是低级的(WHOISUP1998)。12个中只有2个(均为低级,Ta阶段的TCC)是被另一个测试检测出的(1个由NMP22TMELISA和一个由uRNA-D)。分类器-D错过的12个病例中,所有均为Ta阶段的,并且除了1个外,其余均是低级的(WHOISUP1998)。12个中只有2个(均为低级,Ta阶段的TCC)是被另一个测试检测出的(1个由NMP22TMELISA和一个由uRNA-D)。细胞学没有检测到分类器-D错过的任何TCC。患者A:高级肾盂肿瘤T2,没有并发Tis,没有给定大小。患者B:高级膀胱肿瘤T3a,没有并发Tis,2x3cm患者C:高级肿瘤,测量4.8×5.6cm,具有大面积的基质和肌层浸润,延伸至膀胱周的脂肪,无转移的证据。那些采用替代诊断的患者中,根据尿样特性的尿液测试的特异性示于图13。肉眼可见血尿或显微可见血尿的控制组患者比没有肉眼可见血尿或显微可见血尿(p=0.002)的患者更可能有假阳性测试,并且有一个趋势,即患者可能还有结石,虽然通过诊断特异性的差异整体上统计上不显著(p=0.12)。有5例具有其他泌尿癌症的患者;其中只有一个给出了阳性的分类器-D测试结果。拟合逻辑回归模型的结果是相似的。在诊断和肉眼可见血尿或显微可见血尿的逻辑回归模型中,与肉眼可见血尿或显微可见血尿状况的相关性仍然显著(p=0.006),并且当直接相比于无诊断时,结石患者具有2.7倍增加几率的假阳性测试(95%CI(1.1至6.4),p=0.03)。年龄不影响测试的特异性。尿样中检测出的肉眼可见血尿或显微可见血尿是与测试灵敏度明显相关的唯一因素。在这个队列中那些肉眼可见血尿或显微可见血尿患者的阳性测试的预测值是63%,那些没有肉眼可见血尿或显微可见血尿患者的阳性测试的预测值是24%,这主要反映了肉眼可见血尿或显微可见血尿患者中更大的TCC患病率(39%对6%)。有54例TCC患者的分类器-D测试为阳性。这些患者采用分类器-S分类为严重TCC和不严重TCC。严重TCC定义为阶段≥1或任何阶段的3级。在90%的特异性,分类器-S正确分类32/35(91%)的严重TCC病例。示例3:血尿I期患者的基因型和表型组合分析本研究着重于呈现确诊无症状镜下血尿(AH)的患者,其正在经历对可能的尿路上皮癌(UC)的全面临床病情检查。约500例患者被招收到参与了这项研究。如本说明书中所用,术语在额外的示例中定义如下。目标目标用于确定:(1)在计划进行全面泌尿外科临床病情检查的呈现显微可见血尿的患者中基因型和表型算法的疗效,(2)用于在呈现确诊镜下血尿患者中检测初级UC的基因型和表型算法G+P指数的性能特点(灵敏度,特异性,ROC曲线下面积,阳性和阴性预测值);(3)由基因型和表型工具G+P指数正确诊断为UC阴性的患者的数量,他们因此不需要调查性的膀胱镜检查。研究群体研究群体包括呈现确诊显微可见血尿的患者,其满足研究的要求。患者是从由全科诊所转介到泌尿外科诊所的患者中招募的。知情同意计划进行调查性的膀胱镜检查的患者被接触,以讨论可能的参与。患者被告知研究的性质并且得到同意。患者提供人口统计,职业和吸烟史的信息,并在提供尿液样本之前,确保他们充分了解患者信息和知情同意书。研究协调员完成详细介绍基因型和表型指数的相关输入信息的CRF页并传输数据进行分析。纳入标准随后正在进行尿路上皮癌膀胱镜调查的患者被确诊在2或3个妥善收集的尿液样品上临床发现镜下血尿(每高倍视野(HPF)至少3个RBC)。病人愿意遵守研究要求。患者已年满18岁。排除标准尿路上皮癌(UC)病史。当前呈现肉眼可见血尿。确诊(恶性或其他)的肉眼可见血尿发作期的病史(过去12个月)。G+P指数我们开发了新的指数,“G+P指数”,其包括基因型和表型数据两者的组合。基因型(“G”)组成部分利用RNA生物标志物表达信息,与收集自相同时间窗口中的患者的五个临床因素(表型数据“P”)一起使用,以确定AH患者的UC风险。所有患者接受标准的临床病情检查以确定真实的临床结果,并且该研究的输出是以所收集的临床数据和收集自患者尿样的基因型数据为基础的模拟输出。这样,患者护理不会因研究输出的结果而改变。患者提供尿样,其被送去用于遗传分析。患者归类参与本研究的患者的总体护理标准没有变化。根据当前护理标准,所有计划进行全面泌尿科病情检查的患者接受适当的调查。研究数据人口统计学和风险因素信息是基因型和表型指数是输入数据。最终的疾病状态(由灵活的膀胱镜检查和后续检查确定)用(Φ)结果和人口统计信息进行校对,并进行统计分析。G+P指数的确定使用从收集自大量新西兰和澳大利亚站点收集的约500个患者的样本获得的数据集,预测“TCC=yes”可能性的训练模型被开发。收集用于训练和验证群体的变量的数据表型变量临床研究结果是:性别,年龄,吸烟史,和HFREQNEW(<=1表示低;>1表示高)。基因型变量基因型变量包括RNA标志物:M1(=MDK+CDC+IGBP5-HOXA13)和IL8R的表达。下面的表7示出验证G+P指数的因素中的每一个的系数的估算值:表7图18描绘了G+P指数的ROC曲线。图18是根据本发明的实施例的结果的灵敏度(纵轴)对1-特异性(横轴)的图。为了比较,对角线描绘了模型。单独基于表型信息的结果被示为点划线,单独基于基因型信息的结果被示为虚线,基于G+P指数的结果被示为实线。这些结果表明,基因型和表型信息的组合提供了对预测结果的出人意料的、显着的改善。探索模型考虑7个表型变量,但AgeGT50表现影响不大,而RBC数据不足,所以这两个变量从最终模型中去掉。在剩余的五个表型变量和两个RNA标志物的显著性水平基础上,构建一个指数。使用训练数据集中M1,IL8R和TCC(=yes)之间的相互关系,阈值4.5和2.5分别用于M1和IL8R。得分5,4,3,2和1被分配到M1,吸烟者,男,IL8R和HFREQ—这导致指数得分范围从0到15。基于系数的合成算法如下,所组合的G+P指数为:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)被保留在最终模型中的不同临床因素的比值比示于图19。比值比可以依赖于它偏离1(即,没有影响)多远被解释为具有对受试者有害或保护的作用。比值比,其置信界限不包括1,是统计显著的。通常,相比于具有小比值比的因素(例如HFREQ),具有较高比数比的因素(例如SMK,Gender)被分配较大的权重。完整模型的分类表示于下面表8中。表8G+P指数的初步验证研究为了进一步测试G+P指数的使用,我们进行了另一项研究。基于各种临床和RNA标志物的统计显著性,构建一个指数。共有98名受试者,其TCC状态(yes或no)以及G+P指数的变量是可用的。得分5,4,3,2和1被分配到M1(基因测试),吸烟者,男,IL8R和HFREQ—这导致指数得分范围从0到15。真阳性和真阴性的数量分别为6和84。同样,假阳性和假阴性的数量分别为5和3。因此,所提出的指数的总体精度为0.92。基于G+P指数的含义及跟进如果G+P指数结果表明UC“高风险”定义为得分11-15或以上,患者具有接受临床指示的灵活的膀胱镜检查和腹部超声的优先权。如果G+P指数结果表明UC“中风险”定义为得分6-10,患者要接受复查和临床实践的随访。可以考虑使用细胞学,输尿管镜和/或CT扫描。如果G+P指数结果表明UC“低风险定义为得分0-5的”,患者将接受正常标准护理,并被放置在适当的等候名单上。参考文献下列参考文献涉及到上面的公开内容。Agresti,A.andCoull,B.A.(1998)Approximateisbetterthan"ex-act"forintervalestimationofbinomialproportions.TheAmericanStatistician,52,119-126.AltekruseSF,KosaryCL,KrapchoM,NeymanN,AminouR,WaldronW,RuhlJ,HowladerN,TatalovichZ,ChoH,MariottoA,EisnerMP,LewisDR,CroninK,ChenHS,FeuerEJ,StinchcombDG,EdwardsBK(eds).SEERCancerStatisticsReview,1975-2007,NationalCancerInstitute.Bethesda,MD,http://seer.cancer.gov/csr/1975_2007/,basedonNovember2009SEERdatasubmission,postedtotheSEERwebsite,2010.Brown,L.D.Cai,T.T.andDasGupta,A.(2001)Intervalestimationforabinomialproportion.StatisticalScience,16,101-133.Buckhaults等人,(CancerResearch61:6996-7001(2002)describescertainsecretedandcellsurfacegenesexpressedincolorectaltumours.Byrd,R.H.,Lu,P.,Nocedal,J.andZhu,C.(1995)Alimitedmemoryalgorithmforboundconstrainedoptimization.SIAMJ.ScientificComputing,16,1190-1208.Dalgaard(2008)."IntroductoryStatisticswithR,2ndedition";PeterDalgaard,Chapter13(2008),Springer,ISBN978-0-387-79053-4.DeLong,E.R.,D.M.DeLong,andD.L.Clarke-Pearson.1988.Comparingtheareasundertwoormorecorrelatedreceiveroperatingcharacteristiccurves:Anonparametricapproach.Biometrics44:837-845.Gottschalk,P.G.andDunn,J.R.(2005)Thefive-parameterlogistic:Acharacterizationandcomparisonwiththefour-parameterlogistic.AnalyticBiochemistry,343,54-65.Doi:10.1016/j.ab.2005.04.035GrossfieldG,WolfJ,LitwanM,HricakH,ShulerC,AgerterD等人.Asymptomaticmicroscopichematuriainadults:summaryofAUAbestpracticepolicyrecommendations.AFP2001:63:1145-54.Halletal(Laryngoscope113(1):77-81(2003)(PMID:12679418)(Abstract)describedpredictivevalueofserumthyroglobulininthyroidcancer.Hoerl,A.E.(1962)Applicationofridgeanalysistoregressionproblems.ChemicalEngineeringProgress,58,54-59.HolyoakeA,O'SullivanP,PollockR,BestT,WatanabeJ,KajitaY等人.DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes.2008Feb1;14(3):742-9.Hotte等人,(AJ.AmericanCancerSociety95(3):507-512(2002)describesplasmaosteopontinasaproteindetectableinhumanbodyfluidsandisassociatedwithcertainmalignancies.Kim等人,(JAMA287(13):1671-1679(2002)describesosteopontinasapotentialdiagnosticbiomarkerforovariancancer.Koopman等人,(CancerEpidemiol.BiomarkersPrey13(3):487-491(2004)(Abstract)describesosteopontinasabiomarkerforpancreaticadenocarcinoma.Kuo等人(Clin.Chim.Acta.294(1-2):157-168(2000)(Abstract)describesserummatrixmetalloproteinase-2and-9inHCF-andHBV-infectedpatients.Leman等人,(Urology,69(4)714-20(2007)(Abstract)describesEPCA-2asaserummarkerforprostatecancer.LooR,LiebermanS,SlezakJ,LandaH,MarianiA,NicolaisenG,AsperaAandJaconsenS:Stratifyingriskofurinarytractmalignanttumorsinpatientswithasymptomaticmicroscopichematuria.MayoClinProc.2013,88(2);129-138.Lunn,D.,Spiegelhalter,D.,Thomas,A.andBest,N.(2009)TheBUGSproject:Evolution,critiqueandfuturedirections(withdiscussion),StatisticsinMedicine28:3049-3082.Marchi等人,(Cancer112,1313-.1324(2008)(Abstract)describesProApolipoproteinAlasaserummarkerofbrainmetastasesinlungcancerpatients.Martin等人,(ProstateCancerProstaticDis.March9,2004(PMID:15007379)(Abstract)describeduseofhumankallikrein2,prostate-specificantigen(PSA)andfreePSAasmarkersfordetectionofprostatecancer.Mazzaferri等人,(J.Clin.Endocrinol.Metab.88(4):1433-1441(2003)(Abstract)describesthyroglobulinasapotentialmonitoringmethodforpatientswiththyroidcarcinoma.McDonaldM,SwagertyD,WetzelL:AssessmentofMicroscopichematuriainadults.AFP200673:10.Melle等人,(Clin.Chem.53(4),629-635(2007)(Abstract)describesHSP27asaserummarkerforpancreaticadenocarcinoma.More,J.J.(1978)TheLevenberg-Marquardtalgorithm:implementationandtheory,inLectureNotesinMathematics630:NumericalAnalysis,G.A.Watson(Ed.),Springer-Verlag:Berlin,pp.105-116.Nelder,J.A.andMead,R.(1965)Asimplexalgorithmforfunctionminimization.ComputerJournal7,308-31.O'SullivanP,SharplesK,DalphinM等人:AMultigeneUrineTestfortheDetectionandStratificationofBladderCancerinPatientsPresentingwithHematuria.JUrol2012,Vol188No3;746Pellegrini等人,(CancerImmunol.Immunother.49(7):388-394(2000)(Abstract)describesmeasurementofsolublecarcinoembryonicantigenandTIMP1asmarkersforpre-invasivecolorectalcancer.(RDevelopmentCoreTeam(2009).R:Alanguageandenvironmentforstatisticalcomputing.RFoundationforStatisticalComputing,Vienna,Austria.ISBN3-900051-07-0,URLhttp://www.R-project.org/)Richards,F.J.(1959)Aflexiblegrowthfunctionforempiricaluse.JournalofExperimentalBotany.10,290-300.Rudland等人,(CancerResearch62:3417-3427(2002)describesosteopontinasmetastasisassociatedproteininhumanbreastcancer.Sing等人(2009).(TobiasSing,OliverSander,NikoBeerenwinkelandThomasLengauer(2009).ROCR:Visualizingtheperformanceofscoringclassifiers..Rpackageversion1.0-4.http://CRAN.R-project.org/package—ROCR).Speiss,A.-N.,Feig,C.andRitz,C.(2008)HighlyaccuratesigmoidalfittingofrealtimeRCRdatabyintroducingaparameterforasymmetry.BMCBioinformatics,9,221.Doi:10.1186/1471-2105-9-211.SprengerH,LloydAR,LautensLL,BonnerTI,KelvinDJ.Structure,genomicorganization,andexpressionofthehumaninterleukin-8receptorBgene.JBiolChem.1994Apr15;269(15):11065-72.StataCorp.2009.StataStatisticalSoftware:Release11.CollegeStation,TX:StataCorpLP.SchwartzG:Properevaluationofasymptomaticmicroscopichematuriaintheeraofevidence-basedmedicine-progressisbeingmade.MayoClinProc.2013,88(2);123-125.TrivediCandMessingEM:Commentary:theroleofcytologicanalysisofvoidedurineinthework-upofasymptomaticmicrohematuria.BMCUrology2009,9:13Tsigkou等人,(IClinEndocrinolMetab,92(7)2526-31(2007)(Abstract)describestotalinhibinasapotentialserummarkerforovariancancer.Venables,W.N.&Ripley,B.D.(2002).ModernAppliedStatisticswithS.FourthEdition.Springer,NewYork.ISBN0-387-95457-0).Whitley等人,(DimLab.Med.24(1):29-47(2004)(Abstract)describesthyroglobulinasaserummarkerforthyroidcarcinoma.Yoshikawa等人,(CancerLetters,151:81-86(2000)describestissueinhibitorof30matrixmetalloproteinase-1inplasmaofpatientswithgastriccancer.示例4:使用G+P指数II归类呈现血尿的患者当G+P指数值在11至15的范围时,G+P指数指示阳性。定义如在本说明书中使用的,下列定义用在此处和下面的示例中。“AMH”是指无症状显微可见血尿;“AUA”是指美国泌尿学协会;“AUC”是指曲线下面积;“CI”是指置信区间;“CT”是指计算机断层扫描;“ELISA”是指酶联免疫吸附测定;“FISH”是指荧光原位杂交;“HPF”是指高倍视野;“logOR”是指对数比值比;“Hfreq”是指最近血尿发作时血尿的日均频率;“ISUP”是指泌尿病理学国际协会;“MRI”指核磁共振成像;“NPV”指阴性预测值;“OR”表示比值比;“QC”是指质量控制;“QoL”是指生活质量;“表型(Phenotypic)”是用来定义临床预测的特征并将它们与已被广泛地定义为“基因型”变量的基于基因表达的生物标志物区分开。“RBC”指红细胞;“ROC”是指接受者操作曲线;“RT-qPCR”是指定量逆转录聚合酶链反应;“STARD”是指报告诊断精度的标准;“UC”是指尿路上皮癌;“WHO”是指世界卫生组织。简介血尿,其与例如良性前列腺肿大,感染或尿路结石这些原因最经常相关联,但也是尿路上皮癌(UC)的症状,估计一般人群中在1%和22%之间的患者会发生血尿[1,2]。肉眼可见血尿的特征在于患者尿中可见的颜色变化,而显微可见血尿更精确地定义为在3个同时收集的尿样中每高倍视野中存在≥3个红细胞(RBCs/HPF)[2]。显微可见血尿患者中UC的总体发病率已经被报道为约4%,而一些研究一致表明,UC的发病率在肉眼可见血尿的患者中要高得多,范围约为12%-23%[2-6],在泌尿评估中肉眼可见血尿患者的UC发病率达到显微可见血尿患者UC发病率的近四倍[7]。值得注意的是,鉴于美国泌尿学协会(AUA)准则的最近变化[2],已经看到无症状血尿(AMH)的阈值降低至单个样本中≥3RBCs/HPF,并且甚至更低的阈值(≥1RBC/HPF)已经被提出[8],因此将接受泌尿病情检查以调查潜在UC的患者的数量相应增加,并且可预期这些患者对医疗保健系统的整体临床和经济负担相应增加。这种血尿相关的转诊给泌尿科带来了显著的临床负担,因为所有患者必须进行全面的病情检查以提供通常无确定结果的诊断。此外,现有的诊断测试—其中许多是侵入性或具有能够对患者生活质量(QoL)产生不利影响的高辐射负载,特别是如果依照当前指南授权的,患者接受重复的膀胱镜检查[2]。据报道,对于没有预防性抗生素实施膀胱镜检查,22%的患者患有无症状菌,1.9%的患者在30天内发展成发热性尿路感染(UTI)[9]。其他研究也报道了膀胱镜检查之后,肉眼可见血尿,排尿疼痛和男性的短暂勃起功能障碍的患病率较高[10,11]。作为血尿患者接受全面的泌尿病情检查的结果,医疗保健系统也遭受显著的经济负担[12,13],而且已得出结论,尿细胞学检查增加了成本,但没有提供任何显著的诊断益处[14-16]。因此,融合精确的、非侵入性的测试到呈现血尿患者的初级临床病情检查允许医生有效地归类血尿患者,从而降低为检测UC而接受全面泌尿病情检查和调查性膀胱镜检查的患者数目,并提供给患者和医疗保健系统显著的好处[15-19]。一些临床预测的特征,包括年龄,性别,吸烟史及血尿程度,是公认的血尿患者的UC危险因素[3,20-22]。最近,一些团体试图基于临床预测特征来开发预测血尿患者UC风险的模型[20-22],但关键是,这些模型提供了有限的精度且大都集中在检测UC患者而不是排除没有疾病的患者。因此,即使与尿细胞学组合使用,这些关注检测的模型已经不足以在初期评估期间可靠地确定患病的患者[20-22]。尽管呈现肉眼可见血尿患者中UC发病率较高,但是多项研究显示与那些呈现肉眼可见血尿的患者相比,呈现显微可见血尿的患者在UC的分级和分期的分布上无显著差异[5,23-25]。因此,AUA建议所有肉眼可见血尿患者或AMH患者均转诊到泌尿科接受全面的泌尿病情检查,因为血尿的严重程度不足以预测UC的存在[2]。然而,因为在初期评估中,血尿患者可能仅经历有限的尿液分析,包括细胞学和在一些情况下成像研究,例如超声波,所以全面的泌尿病情检查通常是必要的,以决定性地检测到或排除UC。虽然尿细胞学检查被目前的指南指定并且常规地用于疑似UC患者,但是细胞学检查结果往往是非典型或可疑的尚无定论的结果,并且饱受UC相关血尿患者假阳性结果的相对较高风险带来的低诊断率的苦果[2,26,27]。因此,可能很难在初期评估期间排除血尿的良性原因,无论是肉眼可见血尿或AMH,尤其是如果UC相关血尿是间歇性的并在针对良性原因的治疗后似乎痊愈的[12]。许多基于基因的研究已经开始描述UC患者的尿液生物标志物,并且这些生物标志物可以凭自身的能力对检测疾病是有用的[28,29]。也存在机会基于患者的临床特征和基因表达谱对患者归类。与单独的临床特征相比,将NMP22酶联免疫吸附测定(ELISA)测试或一组基因标志物与临床特征组合已经显示出可以提高诊断的准确性,但是这些组合模型尚未在整体诊断准确性上带来显著的进步,特别是当试图识别低风险患者时[30,31]。尽管如此,将临床因素和特异性基因表达结合为组合的算法被认为可能为诊断和管理血尿或UC患者提供最好的指导[32]。CxbladderTMDetect(新西兰,达尼丁,PacificEdgeLtd.),在未分馏的尿液上进行多基因测试之前已经显示出比尿细胞学和NMP22在肉眼可见血尿患者中检测UC更灵敏[33]并且在比较分析中,比尿细胞学,NMP22和荧光原位杂交(FISH)更准确(Kasabov,Darling,Breen等人,未发表的言论)。CxbladderDetect使用定量逆转录聚合酶链反应(RT-qPCR)技术来定量5个mRNA标志物,四个标志物在UC中过度表达,同时第五个标志物在非恶性炎性病症中升高,并且当用于检测呈现血尿的患者中的UC时,CxbladderDetect提供高水平的特异性和灵敏度[33]。据推测,结合收集自同一患者的高性能的遗传标志物和表型变量的综合模型将使用高灵敏度(即UC患者接收假阴性结果的低可能性),高阴性预测值(即所有阴性结果是真实的比例高)和高测试阴性率提供卓越的临床解决方案,以使能精确归类具有UC低概率的患者。当将这些基因型和表型变量组合成新的偏析模型时,能够使具有UC低概率的血尿患者被识别和归类,而不是经历全面的泌尿病情检查。方法患者的选择695例患者的前瞻性样本用于分析,其中采用传统的临床评估确定真实的临床结果。研究样本包括血尿患者的初始队列如前所述得到同意并取样[33],其中一系列连续的517例近期肉眼可见血尿病史,年龄≥45岁,没有UC病史的患者从澳大利亚和新西兰的9个泌尿诊所前瞻性招募。这些患者被随访三个月用于确定UC状态或在尿液样本多基因分析后给出替代诊断,阳性的UC诊断是基于膀胱镜外观和组织病理学检查。采用1998年世界卫生组织(WHO)/泌尿病理学国际协会(ISUP)的共识分类,疾病的阶段根据病理和影像诊断调查确定的TNM分期标准分类,肿瘤分级是按照当地的病理学实践进行划分的[34]。肉眼可见血尿事件后,正在接受泌尿外科调查的另外的94例患者和84例患者的队列随后在2012年3月和2013年4月之间从新西兰的两个中心被招募并包括到模型开发中。在他们之前参加最初的研究的经验及在个人临床环境中评估CxbladderDetect产品的意愿基础上,所述中心被选择参与其中。另外的代表性测试集的45例呈现显微可见血尿的患者被前瞻性地集合并用于对G+P指数的进一步验证,具体如下。合格标准是与[33]相似的,除了患者年龄≥18岁外,那些曾经历了膀胱镜检查以调查UC,并被证明是阴性的,也有资格入选。此外,如在[33]中,显示出指示为UTI或膀胱或肾结石症状的患者,被排除在外。这项研究的伦理批准是由所有参与的中心通过的,并且提供样本的所有患者签署了知情同意书。尿样收集和评估为了提供基因表达数据,使用来自PacificEdge的尿液取样系统收集参与者的单一中段尿样。所有研究样本的多基因分析是根据标准操作程序进行的,如同用于商售的CxbladderDetect多基因测试。来自最初的队列的所有尿样(4.5mL)是膀胱镜检查之前在诊所被收集的,并且经由真空驱动抽吸转为稳定液体,然后在48小时内送到PacificEdge。之后将样本储存于-80℃,直到需要进行批量分析。之后队列的样本以同样的方式进行收集,但是根据PacificEdge诊断实验室实行的修订的质量控制(QC)限制和容限测试,样本在环境温度下运送到PacificEdge并在收集的7天内进行处理。统计分析单变量逻辑回归用来估计与UC相关的4个二进制表型变量的未调整(原始)对数比值比(logOR)系数:性别,吸烟史和患者最近的血尿发作期间血尿的日均频率(Hfreq;参见表9)。表9:与UC相关的二进制表型变量的定义和其相应得分对所有四个表型变量的多变量逻辑回归被用来生成表型模式(P指数)中的调整logOR系数。使用逻辑回归来开发G指数,以确定UC和尿样中五个Detect基因(IGFBP5,HOXA13,MDK,CDK1和CXCR2)的mRNA浓度之间的相关性。使用来自G指数和P指数的所有九个变量的组合生成多变量基因型—表型模型(G+P指数)。这些线性模型确定logOR,患者患有UC的概率可以从logOR导出。每个模型的相对表现在绘出如每个模型确定的测试UC时的假阳性率对真阳性率的接受者操作曲线(ROCs)中说明。曲线下面积(AUC)用来将每个模型的相对效率与被认为接近l是最佳的AUC做对比。当对相同的数据集执行模型估计和预测时,为了减少潜在的偏差,使用自举重复采样[35]为三个逻辑回归模型中的每一个计算偏差修正的AUC。来自原始样本的名义AUC和来自自举样本的平均AUC之间的差值是样本偏差的估计值,并且名义AUC进行相应调整。也得到偏差修正置信区间(CIs)自举估计值[36]。此外,每个模型的性能特点必须超过0.97的NPV阈值,其为此临床测试的设计标准,采用具有高测试阴性率的进一步附加说明而具有尽可能高的灵敏度。当归类(triaging)出具有UC低概率的呈现血尿的患者时,选择测试阴性率以提供较高的临床解决方案。在G指数,P指数和G+P指数之间作比较,并且根据灵敏度和具有足够高的测试阴性率的NPV确定每个模型的性能,以提供用于归类(triaging)出具有UC低概率的血尿患者的有效工具。结果样本人口跨三个队列登记的695例肉眼可见血尿例患者中,由于缺乏足够的数据或者样本而未能达到QC标准,23例被认为不合格,并且来自另外85例患者的样本在注册后被排除(参见图20A)。总计,来自587例患者的样本可用于为包括72例UC阳性和515例UC阴性的样本建模。在提供的来自显微可见血尿患者的45个样本中,40个适合于分析,5例患者被认为不合格,并从分析中排除(参见图20B)。所有45例患者接受了全面的泌尿评估而且临床事实被确认为UC阴性。来自两个样本群体的全部人口统计数据列于表10。表10:肉眼可见血尿和显微可见血尿患者的采用完整数据的样本群体人口统计特征肉眼可见血尿患者的表型变量和UC风险的关系四个二进制表型变量的每一个的未调整的单变量逻辑回归分析表明,年龄≥60岁,男性,吸烟史和肉眼可见血尿的高频率均与UC的风险增加相关(表11)。表11:血尿患者通过表型和基因型因素UC的未调整和调整的OR调整的P指数,G指数和G+P指数变量OR分别是P指数,G指数和G+P指数的取幂系数。用多变量逻辑回归模型计算调整的logOR系数。P指数=-3.78+0.81×Age+0.46×Gender+0.78×Smokinghistory+0.59×Hfeq如表9指定的,其中每个表型变量被分配给二进制得分0或1,并且系数的置信区间在表11给出。P指数的AUC的偏差修正估计值为0.66(95%CI:0.55-0.67;图21)。肉眼可见血尿患者的基因型变量与UC风险之间的关系G指数使用尿样中的五个基因IGFBP5,HOXAI3,MDK,CDKI和CXCR2的mRNA浓度的对数通过逻辑回归进行估算以预测UC的发生。G指数=-6.22+0.77×IGFBP5-1.11×HOXA13+1.56×MDK+1.24×CDK1-0.43×CXCR2G指数给出0.83的偏差修正AUC(95%CI:0.74-0.89;图21)。肉眼可见血尿患者的基因型和表型变量与UC风险之间的关系然后五个连续基因型变量与四个二进制表型变量组合,以使用多变量逻辑回归估算G+P指数。G+P指数=-8.46+(0.79×IGF-1.60×HOXA+2.10×MDK+0.95×CDC-0.38×IL8R)+(0.64×Age+1.11×Gender+0.98×Smokinghistory+0.56×Hfeq)G+P指数给出0.86的偏差修正AUC(95%CI:0.80-0.91)。G指数和G+P指数的比较G指数和G+P指数的置信区间之间有重叠,所以配对测试的自举版本是通过确定每个自举样本的G指数和G+P指数的AUC的差构建的。通过从可用于分析的原始587个样本随机抽样替代原始样本来生成样本大小n=587的一万个自举样本。模型之间的差异所产生的95%CI为0.01-0.08。因此,两个AUC之间的真实差小于0.01的概率<0.025,这表明G+P指数的AUC显著大于G指数的AUC的可能性高。模型的NPV和灵敏度G+P指数在测试阴性率从0.2到0.7的范围内产生NPV>0.97,并且几乎总是高于G指数模型的NPV(图22)。当测试阴性率为0.4时,G+P指数提供敏感性为0.95和NPV为0.98的性能特征(表12;图22)。与此相反,当测试阴性率为0.4时,G指数只达到0.86的灵敏度和NPV0.96(表12)。表12:当为改变测试阴性率设置阈值时,每个模型的性能特征G+P指数在显微可见血尿患者中的应用虽然G+P指数是使用来自肉眼可见血尿患者的数据开发的,但它的稳健性在来自显微可见血尿(Hfreq=0)患者的另外40个样本中被测试。预期在显微可见血尿群体中测试阴性率更高,因为UC的发病率在该群体中较低,并且使用0.4的测试阴性率,32(80%)例患者测试为阴性并将被正确地归类出来,因此不需要全面的泌尿外科病情检查以确定UC。讨论本研究定义了一个临床工具,其提供给临床医生和医师为了UC检测有效地从需要进行全面的泌尿病情检查中归类出呈现血尿患者的能力。该研究提出了采用基于自举的CI估计值的内部验证的基因型—表型模式,G+P指数,其提供了高灵敏度和高NPV(即个别UC患者的低概率提供了假阴性结果,而所有阴性结果的高比例为真)的组合,该组合不是排他地单独由基因型或表型数据得到的模型所提供的。这为临床医生和医师提供了一个独特的机会,来归类出肉眼可见血尿和显微可见血尿患者,特别是通过识别不需要全面的泌尿外科病情检查的具有UC低风险的患者。在高灵敏度情况下的高测试阴性率是有效的归类测试的重要考虑因素,归类测试旨在引导UC低概率患者远离全面的临床病情检查[37]。因此,在0.4的测试阴性率时,这里提出的G+P指数的灵敏度最大化了灵敏度和NPV两者(分别为0.95和0.98)。这可以与选自[33]中公开的基因型模型中的最佳拟合(灵敏度=0.82;NPV=0.97)作比较,并且也是与膀胱镜检查(灵敏度=0.89-0.98;NPV=0.99)和使用计算机断层(CT)扫描或磁共振成像(MRI)的虚拟膀胱镜(灵敏度分别为0.94和0.91)两者的灵敏度和NPV可比较的[38-40]。应当承认,在这种情况下用来推导G指数,P指数和G+P指数的样本群体由肉眼可见血尿患者组成。然而,在0.4的测试阴性率下,这个对肉眼可见血尿患者测试的高灵敏度允许G+P指数被应用在肉眼可见血尿和显微可见血尿群体两者上。假定有UC和没有UC的患者类似地分布在显微可见血尿和肉眼可见血尿患者群体中,因为在显微可见血尿群体中为4%的预期UC发病率,也可以在显微可见血尿患者人群中预期高NPV。通过将G+P指数应用到没有UC的显微可见血尿患者的样本群体上,已表明基于结果,80%的患者会被归类出来。只有20%的会被转诊做全面的泌尿科病情检查。这与传统指南相比,目前看到所有不能归因于良性原因的显微可见血尿患者(100%)均要经历全面的泌尿科病情检查,招致不必要的重大成本并负面影响患者的QoL。血尿的严重程度与患者患有UC的概率相关,但与任何肿瘤的阶段或等级无关,估计转诊到泌尿科的分别为96%的显微可见血尿患者和77-88%的肉眼可见血尿患者没有UC[2-6]。因此,避免血尿患者的潜在地不必要的泌尿外科病情检查有几个好处。膀胱镜检查可与副作用,例如排尿疼痛,出血,尿路感染,男性性功能障碍和伴随不确定或未经确认的UC诊断[9-11]的焦虑相关联。最值得注意的是,这种新方法具有减少资源负担和减少与UC阴性患者的全面泌尿病情检查相关的经济成本的潜力。例如,在英国,最初的细胞学和/或肿瘤标志物测试为阴性的血尿患者避免做膀胱镜检查已经被评估为,每名被评估的患者节省约770美元(每名患者483英镑)[13]。当用在初期评估环境时,这里所描述的G+P指数提供了对使用尿细胞学的有效的替代。这在初级评估是由初级保健医生进行的环境中尤为重要。在此基础上,如果我们指定每次全面泌尿病情检查任意的“名义成本”为4,500美元,1000名显微可见血尿患者的病情检查总成本为接近450万美元。相反,如果任意的名义成本为2,500美元、80%的显微可见血尿患者利用G+P指数被归类出来,那么剩余20%患者接受测试和全面泌尿科病情检查的总直接成本为340万美元。这提供了每1000例显微可见血尿患者理论净节省约110万美元的直接成本。虽然由O'Sullivan等人开发的基因型算法[33]由与呈现在这里的G+P指数相同的基因型成分组成,但是敏感性和特异性之间的平衡为了正在经历全面的泌尿科病情检查的有症状患者(即呈现血尿)的最佳初级UC检测而进行校准。相反,本研究中的G+P指数还纳入了表型变量,并且已经被优化为高灵敏度和高NPV,以分离出那些不需要针对疑似UC的全面的泌尿科病情检查的血尿患者。没有试图定义或选择UC患者。取而代之的目的是有把握地排除那些没有UC的患者,因此,所有没分离出来的患者将进行全面的泌尿病情检查。虽然当评估呈现血尿患者的UC风险时,一些研究之前已经寻求开发考虑表型的预测模型,但是单独的依赖表型的模型的准确性好像是有限的。例如,Loo等人[21]前瞻性地调查了表型参数是否可以用来确定可能不需要泌尿外科转诊和全面病情检查的显微可见血尿患者,并且得出结论,年龄、男性和近期诊断为肉眼可见血尿是UC的显著预测指标。吸烟史和在最近的尿检>25RBCs/HPF孤立地不是UC的统计显著预测指标,但是即使当被包括在他们的‘血尿风险指数’中以提高预测的准确性时,该指数得到0.809的AUC[21]。有趣的是,对于吸烟史和性别,,这项研究中的表型的OR和那些由Loo等人识别的表型参数可与重叠的95%CI相比,并且虽然年龄、性别和吸烟史在每个模型中有类似的加权,呈现在这里的G+P指数的基因型组分的影响可能引起更高的AUC[21]。同样,Cha等人[20]报道,年龄、吸烟史和血尿的程度,而不是性别,是与无症状性血尿患者的UC存在显著相关的,并使用了多变量模型来开发由预测UC的表型和尿细胞学检查数据组成的列线图。如同Loo等人[21]的研究,所报道的表型OR与这里报道的那些表型OR是可比的,但是即使在将尿细胞学列入到列线图之后,在[20]中报道的0.831的AUC低于G+P指数的AUC。在另一项研究中,Tan等人[22]使用由患者的年龄,性别,吸烟史和血尿程度得到的列线图,回顾性地分层被转诊到专门的泌尿外科诊所的血尿患者到高风险组和低风险组。虽然由于缺乏数据(405例患者中的80例)大部分的患者被排除,与本研究的比较必须谨慎,0.804的AUC,0.900的敏感性和0.953的NPV均低于这里描述的G+P指数。也已经进行了多种尝试通过用尿生物标志物测试的结果补充它们来改善表型模型的精确度。当护理蛋白质组学测定的核基质蛋白NMP22点被孤立地用于检测UC,它具有0.557的灵敏度和0.968的NPV[17]。Lotan等人[41]发表了多变量算法,包括表型因素,NMP22和尿细胞学和用0.802[31]的AUC进行前瞻性验证的预测UC的0.826的AUC。但是,要注意的是,这个模型试图在有和没有UC的高风险患者之间作区分,而不是最大化敏感性和NPV以归类出UC低概率的患者。特别是,用包含基因型和表型数据的算法得到的改进的精度以前已经在乳腺癌中证明了[42-45]。同样,Mitra等人[30]使用分子标志物和吸烟强度的组合来计算多变量模型,其优于在预测UC患者幸存的常规临床病理参数。然而,本研究首次证明表型风险因素可以与基因型数据相结合,以增加模型的准确性,该模型分离血尿患者到需要不同水平的泌尿外科跟进和临床护理的类别,而不是预测幸存的。当表型数据与模型中的基因型数据相结合,数据的解析可能影响模型的准确度。例如,吸烟是很好理解的UC风险因素,并且包括在用于检测UC的大多数表型模型中。在Cha等人[20],Tan等人[22],Lotan等人[31,41]和当前的研究中,使用二进制判别式从不吸烟者和当前/以前吸烟者,而Mitra等人[30]基于吸烟年限和每天吸烟数量计算吸烟强度,Loo等人[21]分类吸烟者为从不吸烟,被动吸烟者,已戒烟的吸烟者和当前吸烟者。虽然已知的是暴露于吸烟显著增加UC风险[46],随意地定义的表型变量可以限制表型模型的总体精度和效用。与此相反,患者的基因型和表型变量之间的相互作用就不会无法预期。然而,结合表型因素和遗传变量的影响到单个工具中改进了这项研究中所描述的模型的准确度。类似的原则也适用于描述血尿表型。呈现显微可见血尿或肉眼可见血尿的患者基本上是在生物连续体上,并且有患有UC[2-6,21]的不同可能性。因此,尽管本研究中的所有显微可见血尿患者具有0的Hfreq得分,他们血尿的严重程度,与其他表型因素组合,可能是间接地体现在G+P指数的基因型成分中。参考文献紧接下面列举的文章参考示例4,并且通过充分引用全部并入本说明书中。1.KellyJD,FawcettDP,GoldbergLC:Assessmentandmanagementofnon-visiblehaematuriainprimarycare.BMJ2009,338:a3021.2.DavisR,JonesJS,BarocasDA,CastleEP,LangEK,LeveilleeRJ,MessingEM,MillerSD,PetersonAC,TurkTMT,WeitzelW:Diagnosis,evaluationandfollow-upofasymptomaticmicrohematuria(AMH)inadults:AUAguideline.JUrol2012,188(6Suppl):2473-2481.3.SuttonJM,Evaluationofhematuriainadults.JAMA1990,263:2475-2480.4.KhadraMH,PickardRS,CharltonM,PowellPH,NealDE:Aprospectiveanalysisof1,930patientswithhematuriatoevaluateclinicalpractice.JUrol2000,163:524-527.5.DavidsonP:Re-designofahaematuriaclinic:Assessmentof2346haematuriapatients.JUrol2011,185(4S):e495.6.PriceSJ,ShephardEA,StapleySA,BarracloughK,HamiltonWT:Non-visibleversusvisiblehaematuriaandbladdercancerrisk:Astudyofelectronicrecordsinprimarycare.BrJGenPract2014,64:e584-e589.7.ButeauA,SeidemanCA,SvatekRS,YoussefRF,ChakrabatiG,ReedG,BhatD,LotanY:Whatisevaluationofhematuriabyprimarycarephysicians?Useofelectronicmedicalrecordstoassesspracticepatternswithintermediatefollow-up.UrolOncol2014,32:128-134.8.JimboM:Evaluationandmanagementofhematuria.PrimCare2010,373:461-472.9.HerrHW:Theriskofurinarytractinfectionafterflexiblecystoscopyinbladdertumorpatientswhodidnotreceiveprophylacticantibiotics.JUrol2014Jul18.pii:S00225347(14)03963-9.10.BurkeDM,ShackleyDC,O'ReillyPH:Thecommunity-basedmorbidityofflexiblecystoscopy.BJUInt2002,89:347-349.11.StavK,LeiboviciD,GorenE,LivshitzA,SiegelYI,LindnerA,ZismanA:Adverseeffectsofcystoscopyanditsimpactonpatients'qualityoflifeandsexualperformance.IsrMedAssocJ2004,6:474-478.12.RaoPK,JonesJS:Howtoevaluate'dipstickhematuria':Whattodobeforeyourefer.CleveClinJMed2008,75:227-233.13.RodgersM,NixonJ,HempelS,AhoT,KellyJ,NealD,DuffyS,RitchieG,KleijnenJ,WestwoodM:Diagnostictestsandalgorithmsusedintheinvestigationofhaematuria:systematicreviewsandeconomicevaluation.HealthTechnolAssess2006,10:iii-iv,xi-259.14.FalebitaOA,LeeG,SweeneyP:Urinecytologyintheevaluationofurologicalmalignancyrevisited:isitstillnecessary?UrolInt2010,84:45-49.15.FeiferAH,SteinbergJ,TanguayS,AprikianAG,BrimoF,KassoufW:Utilityofurinecytologyintheworkupofasymptomaticmicroscopichematuriainlow-riskpatients.Urology2010,75:1278-1282.16.SvatekRS,HollenbeckBK,S,LeeR,KimS,StenzlA,LotanY.Theeconomicsofbladdercancer:Costsandconsiderationsofcaringforthisdisease.EurUrol2014,66:253-262.17.GrossmanHB,MessingE,SolowayM,TomeraK,KatzG,BergerY,ShenY:Detectionofbladdercancerusingapoint-of-careproteomicassay.JAMA2005,293:810-816.18.FriedlanderDF,ResnickMJ,YouC,BassettJ,YarlagaddaV,PensonDF,BarocasDA:Variationintheintensityofhematuriaevaluation:atargetforprimarycarequalityimprovement.AmJMed2014,127:633-640.19.ShinagareAB,SilvermanSG,GershanikEF,ChangSL,KhorasaniR:Evaluatinghematuria:impactofguidelineadherenceonurologiccancerdiagnosis.AmJMed2014,127:625-632.20.ChaEK,TirsarLA,SchwentnerC,HennenlotterJ,ChristosPJ,StenzlA,MianC,MartiniT,PychaA,ShariatSF,Schmitz-BJ:Accurateriskassessmentofpatientswithasymptomatichematuriaforthepresenceofbladdercancer.WorldJUrol2012,30:847-852.21.LooRK,LiebermanSF,SlezakJM,LandaLM,MarianiAJ,NicolaisenG,AsperaAM,JacobsenSJ:Stratifyingriskofurinarytractmalignanttumorsinpatientswithasymptomaticmicroscopichematuria.MayoClinProc2013,88:129-138.22.TanGH,ShahSA,AnnHS,HemdanSN,ShenLC,GalibNAFA,SingamP,KongCHC,HongGE,BahadzorB,ZainuddinZM:Stratifyingpatientswithhaematuriaintohighorlowriskgroupsforbladdercancer:anovelclinicalscoringsystem.AsianPacJCancerPrev2013,14:6327-6330.23.SultanaS,GoodmanC,BryneD,BaxbyK:Microscopichaematuria:urologicalinvestigationusingastandardprotocol.BrJUrol1996,78:691-698.24.SugimuraK,IkemotoS-I,KawashimaH,NishisakaN,KishimotoT:Microscopichematuriaasascreeningmarkerforurinarytractmalignancies.IntJUrol2001,8:1-5.25.ViswanathS,ZelhofB,HoE,SethiaK,MillsR:Isroutineurinecytologyusefulinthehaematuriaclinic?AnnRCollSurgEngl2008,90:153-155.26.SteinerH,BergmeisterM,VerdorferI,GranigT,MikuzG,BartschG,StoehrB,BrunnerA:Earlyresultsofbladder-cancerscreeninginahigh-riskpopulationofheavysmokers.BJUInt2008,102:291-296.27.YeungC,DinhT,LeeJ:Thehealtheconomicsofbladdercancer:Anupdatedreviewofthepublishedliterature.Pharmacoeconomics2014,32:1093-1104.28.HolyoakeA,O'SullivanP,PollockR,BestT,WatanabeJ,KajitaY,MatsuiY,ItoM,NishiyamaH,KerrN,daSilvaTatleyF,CambridgeL,ToroT,OgawaO,GuilfordP:DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes2008,14:742-749.29.SapreN,AndersonPD,CostelloAJ,HovensCM,CorcoranNM:Gene-basedurinarybiomarkersforbladdercancer:anunfulfilledpromise?UrolOncol2014,32:48.e9-e17.30.MitraAP,CastelaoJE,HawesD,Tsao-WeiDD,JiangX,ShiSR,DatarRH,SkinnerEC,SteinJP,GroshenS,YuMC,RossRK,SkinnerDG,CortessisVK,CoteRJ:Combinationofmolecularalterationsandsmokingintensitypredictsbladdercanceroutcome.Cancer2013,119:756-765.31.LotanY,SvatekRS,KrabbeLM,XylinasE,KlatteT,ShariatSF:Prospectiveexternalvalidationofmodelforbladdercancerdetection.JUrol2014,192:1343-1348.32.AbogunrinF,O'KaneHF,RuddockMW,StevensonM,ReidCN,O'SullivanJM,AndersonNH,O'RourkeD,DugganB,LamontJV,BoydRE,HamiltonP,NambirajanT,WilliamsonKE:Theimpactofbiomarkersinmulti-variatealgorithmsforbladdercancerdiagnosisinpatientswithhematuria.Cancer2012,118:2641-2650.33.O'SullivanP,SharplesK,DalphinM,DavidsonP,GillingP,CambridgeL,HarveyJ,ToroT,GilesN,LuxmananC,FelipeAlvesC,YoonHS,HinderV,MastersJ,Kennedy-SmithA,BeavenT,GuilfordP:Amultigeneurinetestforthedetectionandstratificationofbladdercancerinpatientspresentingwithhematuria.JUrol2012,188:741-747.34.EpsteinJI,AminMB,ReuterVR,MostofiFK:TheWorldHealthOrganization/InternationalSocietyofUrologicalPathologyconsensusclassificationofurothelial(transitionalcell)neoplasmsoftheurinarybladder.BladderConsensusConferenceCommittee.AmJSurgPathol1998,22:1435-1448.35.EfronB,TibshiraniRJ:Anintroductiontothebootstrap.NewYork:ChapmanHill;1993.36.DiCiccioTJ,TibshiraniRJ:Bootstrapconfidenceintervals.StatistSci1996,11:189-228.37.Van'tHoogAH,CobelensF,VassallA,vanKampenS,DormanSE,AllandD,EllnerJ:Optimaltriagetestcharacteristicstoimprovethecost-effectivenessoftheXpertMTB/RIFassayforTBdiagnosis:Adecisionanalysis.PLoSONE2013,8:e82786.38.QuX,HuangX,WuL,HuangG,PingX,YanW:Comparisonofvirtualcystoscopyandultrasonographyforbladdercancerdetection:Ameta-analysis.EurJRadiol2010,80:188-197.39.MowattG,N'DowJ,ValeL,NabiG,BoachieC,CookJA,FraserC,GriffithsTR;AberdeenTechnologyAssessmentReview(TAR)Group:Photodynamicdiagnosisofbladdercancercomparedwithwhitelightcystoscopy:Systematicreviewandmeta-analysis.IntJTechnolAssessHealthCare2011,27:3-10.40.BuickCG,NazirSA,MallettS,TurneyBW,OnwuNN,RobertsIS,CrewJP,CowanNC:Evaluationofdiagnosticstrategiesforbladdercancerusingcomputedtomography(CT)urography,flexiblecystoscopyandvoidedurinecytology:resultsfor778patientsfromahospitalhaematuriaclinic.BJUInt2012,110:84-94.41.LotanY,CapitanioU,ShariatSF,HuttererGC,KarakiewiczPI:Impactofclinicalfactors,includingapoint-of-carenuclearmatrixprotein-22assayandcytology,onbladdercancerdetection.BJUInt2009,103:1368-1374.42.TyrerJ,DuffySW,CuzickJ:Abreastcancerpredictionmodelincorporatingfamilialandpersonalriskfactors.StatMed2004,23:1111-1130.43.DubskyP,BraseJC,JakeszR,RudasM,SingerCF,GreilR,Dietze0,LuisserI,KlugE,SedivyR,BachnerM,MayrD,SchmidtM,GehrmannMC,PetryC,WeberKE,FischK,KronenwettR,GnantM,FilipitsM,onbehalftheAustrianBreastandColorectalCancerStudyGroup(ABCSG):TheEndoPredictscoreprovidesprognosticinformationonlatedistantmetastasesinER+THER2—breastcancerpatients.BrJCancer2013,109:2959-2964.44.BrentnallAR,EvansDG,CuzickJ:DistributionofbreastcancerriskfromSNPsandclassicalriskfactorsinwomenofroutinescreeningageintheUK.BrJCancer2014,110:827-828.45.FilipitsM,NielsenTO,RudasM,GreilR,H,JakeszR,Bago-HorvathZ,DietzeO,RegitnigP,Gruber-RossipalC,Müller-HolznerE,SingerCF,MlineritschB,DubskyP,BauernhoferT,HubalekM,KnauerM,TraplH,FeslC,SchaperC,FerreeS,LiuS,CowensJW,GnantM,AustrianBreastandColorectalCancerStudyGroup:ThePAM50risk-of-recurrencescorepredictsriskforlatedistantrecurrenceafterendocrinetherapyinpostmenopausalwomenwithendocrine-responsiveearlybreastcancer.ClinCancerRes2014,20:1298-1305.46.KrabbeLM,SvatekRS,ShariatSF,MessingE,LotanY:BladderCancerRisk:UseofthePLCOandNLSTtoIdentifyasSuitableScreeningCohort.UrolOncol.20149July16):pii:S1078-1439(14)00215-4.结论总之,这里报告的G+P指数表明了改变临床实用的重大机会。G+P指数能够准确地归类出患者,其呈现血尿给他们的临床医生或医师,并具有高整体测试阴性率、高水平灵敏度和高NPV的UC概率很低。这个模型适合于在血尿患者的初期评估过程中使用以归类出不需要全面的泌尿科病情检查的患者,从而潜在地减少了为了针对UC的专业泌尿外科评估而需要转诊的血尿患者的数量,并有助于保持患者的QoL以及减少诊断相关的费用。示例5:使用G+P指数III归类血尿患者(“G2”)G+P指数进一步用于根据UC风险对患者进行分类。然后风险类别用于为患者划分优先次序用于继续调查。本示例提供了用于使用指数归类(triaging)患者的替代性方法,在本说明书中称为“G2+P指数”。它与上述示例4描述的G+P指数相似。G2的定义这个分类器计算下面的公式:M1=[IGF]–[HOXA]+[MDK]+[CDC];然后,R=-6.9802+0.2007*M1+1.7893*[IL8R]+0.1552*M12-0.2882*[IL8R]2-0.0720*M1*[IL8R]获得的得分:SCORE=eR/(1+eR),其中[IGF],[HOXA],[MDK],[CDC]和[IL8R]分别是基因IGF,HOXA,MDK,CDC和IL8R的样本浓度的对数;“*”是普通的乘法,e=2.718282...是自然(Napierian)对数的底数。高得分表示存在UC的可能性较高。作为示例,我们可以设定0.12的阈值并宣布SCORE>=0.12作为患有UC的可能性高,低于0.12的得分为患有UC的可能性低。示例6:同时使用[G1=P]—指数和G2归类出低概率尿路上皮癌的呈现血尿的患者A.显微可见血尿患者患者数据集·45例患者样本被测定。·5例患者缺乏吸烟状况并从本分析中被排除。·所有患者都完成了全面的泌尿科病情检查,并且都没有尿路上皮癌。·表型变量:性别,年龄,吸烟状况·病人的人口统计示于下表13。表13观察到的测试阴性率:使用测试阴性率40%作为阈值,数据示于下表14。表14测试阴性率40%LR<0.120.12<=LR<0.230.23<=LR归类阴性2831归类阳性422使用测试阴性率50%作为阈值,数据示于下表15。表15测试阴性率50%LR<0.120.12<=LR<0.230.23<=LR归类阴性2833归类阳性420使用测试阴性率60%作为阈值给出了相同的结果/对此归类分类,风险最高组(男,当前或之前吸烟者,年龄>=60)均为阳性。总结和结论1.根据临床指导原则的约定,所有41例患者将通常会接受全面泌尿病情检查。2.所有41例患者确实接受了全面的病情检查并且被确定没有尿路上皮癌。3.在测试阴性率(TNR)为50%,85%的显微可见血尿患者将被筛选出,因此,结果是不用接受全面的泌尿病情检查。4.如果在50%的TNR使用Cxbladder-归类(归类指数-3.33),则85.4%的患者将被归类出来,因此,正确地将不会接受全面的泌尿病情检查。5.如果在40%的TNR使用Cxbladder-归类(归类指数-3.0),则80.5%的患者将被归类出来,因此,结果是正确地将不会接受全面的泌尿病情检查。B.肉眼可见血尿患者患者数据集使用来自临床试验数据和NorthShoreandCURT产品试用的587个样本。这个数据集是由包含年龄,性别,吸烟状况和血尿频率,以及IGF,HOXA,MDK,CDC,IL8R的基因浓度的完整数据构成的子集。我们使用了用于开发下面的Cxbladder-归类模型的相同数据;G+P指数=-8.46+0.79IGF-1.60HOXA+2.10MDK+0.95CDC-0.38IL8R+0.98SNS+0.56Hfreq+1.11Gender+0.64Age我们在图24中绘制了针对G2诊断得分的归类得分。归类阈值-3.33,-2.99和-2.71分别对应于测试阴性率40%,50%和60%。垂直线是0.12和0.23的Cxbladder阈值。实心圆对应肿瘤;绿色是Ta,红色是所有其他更高阶段的肿瘤。表16示出了临床研究结果。表16阶段无癌症T1T2T2aT3TaTis数目515161012403我们考虑了图24的4个象限的计数并且通过各个临界值确定归类指数和G2。-3的Cxbladder-归类(归类指数)的阈值对应于50%的测试阴性率。表17示出了这些结果。表17使用-3.33的Cxbladder-归类阈值(40%的试验阴性率)和相同的0.12的G2阈值,我们观察到的数据示于表18。表18总结和结论1.在相同的时间间隔对相同患者使用Cxbladder归类(G+P)和Cxbladder检测(G2)的系列组合把患者全面分离到四个主要临床分组中。2.对于呈现显微可见血尿和肉眼可见血尿的患者的组合群体,并使用40%的试验阴性率,587例患者中的235例(40.0%)被归类出来。发明人的结论是这些患者将不需要检测UC的全面的病情检查。3.对于同一群体,相应的剩余组352(60%)例患者将接受全面的泌尿科病情检查。4.这个剩余组包含了所有的高级和晚期肿瘤。这些患者没有被归类出来,因此结果是将正确地接受全面的泌尿科病情检查。5.共有4例低级Ta’s(肿瘤总数的5.6%)将被归类出来,并且不会接受全面的病情检查。6.如果归类规则允许归类出所有低于40%的测试阴性率并且G2得分<0.12的患者,则共有13例低级Ta’s被归类出来,其将不会接受全面的病情检查,并且所有高级晚期肿瘤会被找出并接受全面的泌尿科病情检查。7.这些修改的归类规则也导致在所有587例患者中共有440例患者被归类出来(75%)。优势和总体结论结论是,这里报告的G+P指数表明了改变临床实用的显著机会。G+P指数能够准确地归类出患者,其呈现血尿给他们的临床医生或医师,其具有高整体测试阴性率、高水平灵敏度和高NPV的UC低概率。这个模型适合于由初级护理医生用于归类不需要全面的泌尿科病情检查的患者,从而减少了需要转诊以接受专业泌尿外科UC评估的血尿患者的数量,并有助于保持患者的生活质量以及减少了诊断相关的费用。本公开的方法提供了对那些血尿患者的继续调查缺乏需求的出人意料地准确的评估。这些代表不使用本说明书中公开的方法已经不能取得出色的效果。通过引用并入所有专利、专利申请和非专利文献引文全部通过引用并入本说明书中,如同分别以如此方式并入。行业实用性本发明的实施例是在医疗保健和医药领域是有用的。
技术领域:
:本发明的实施例提供了高度准确、灵敏和特异性的计算机实现的方法,用于归类(triaging)患者,以确定哪些患者不需要真正的短期程序或后续处理。该方法基于来自血尿患者的特定遗传和表型信息分析通过提供新的和非显而易见的计算机操作来改进计算机操作,其产生真实的,有用的和具体的成果,以提高医疗质量和降低成本。当前第1页1 2 3 当前第1页1 2 3
技术领域:
:本发明涉及检测没患有疾病的患者。具体地,本发明涉及使用遗传标志物(geneticmarker)和表型标志物(phenotypicmarker)来归类(triaging)患有血尿但没有癌症的患者。特别是,本发明涉及在归类肉眼可见血尿或显微可见血尿患者时对遗传标志物和表型标志物的分析。更特别地是,本发明涉及组合使用遗传标志物和表型标志物来归类无临床症状的肉眼可见或显微可见血尿患者以及预测患者的病情是否需要进一步的临床处理。
背景技术:
::癌症的早期治疗大大提高癌症患者的存活率。在膀胱癌的情况下,相比于病变转移患者5年6%的存活率,诊断为局限于原发部位疾病的患者5年的存活率为73%(Altekruse等人)。因此,膀胱癌早期和准确诊断的发展可以导致对患者的改善的预后。为协助癌症的早期检测,大量癌症特异性标志物已经得到确认。然而使用这些标志物会导致患有炎性膀胱疾病,但没有膀胱癌的患者的假阳性结果。无症状血尿(“AH”)是最常见的泌尿系统疾病的发现方式之一,根据人口数量其发病率在2%和30%之间(SchwartzG:Properevaluationofasymptomaticmicroscopichematuriaintheeraofevidence-basedmedicine-progressisbeingmade.MayoClinProc.2013,88(2);123-125;McDonaldM,SwagertyD,WetzelL:AssessmentofMicroscopichematuriainadults.AFP200673:10,GrossfieldG,WolfJ,LitwanM,HricakH,ShulerC,AgerterD等人.Asymptomaticmicroscopichematuriainadults:summaryofAUAbestpracticepolicyrecommendations.AFP2001:63:1145-54)。然而,AH表明泌尿系统恶性肿瘤发病率的病症在AH群体中的大范围为1.9-7%。对所有确诊AH患者进行的全面诊断工作对许多医疗保健系统是很大的负担。使用表型指标来分开高风险和低风险的患者已经在Loo等人一项最近的研究中被探索。(LooR,LiebermanS,SlezakJ,LandaH,MarianiA,NicolaisenG,AsperaAandJaconsenS:Stratifyingriskofurinarytractmalignanttumorsinpatientswithaymptomaticmicroscopichematuria.MayoClinProc.2013,88(2);129-138)。上述研究中有4414例呈现确诊AH的患者,该研究表明其中73%的患者没有查明的原因,而26%的患者需要某种形式的泌尿科病情检查以查明原因。约2.5%呈现AH的患者被诊断为有尿路上皮肿瘤,其它疾病例如尿路感染(UTI)(2.3%),肾结石(16.2%),前列腺出血(4%),和污染(0.4%)构成其他的诊断(Loo等人,同上)。技术实现要素:我们已经识别了该领域中的新问题,即如何辨别出无膀胱癌或有低膀胱癌风险但呈现血尿的患者。这解决了许多具有血尿但不是膀胱癌的患者可能经历并不需要的昂贵的和进一步侵入性的病情检查的问题。因此,本发明有用之处在于,当遗传信息和表型信息的组合提供辨别出无膀胱癌或有低膀胱癌风险的患者时,将这些个体从针对膀胱癌的全面病情检查的危险和费用中排除,并且本发明可以有效地将没患有癌症的患者从那些患有癌性疾病的患者,包括膀胱上皮癌,移行细胞癌(TCC)和非癌疾病的患者,包括炎性疾病中归类出来。本发明提出了解决新问题的新方法,因为该方法对诊断非癌症,而不是诊断癌症是出乎意料地有用的。使用遗传标准和表型标准的组合出乎意料地提供了比单独的遗传变量或表型变量更好的辨别力。数据从541次观察中得出,这些观察来自于用于内部验证的、使用自举程序的在CLIA标准和CURT+NorthShore下具有法律效力的产品试验。表型变量包括:(1)吸烟史、(2)血尿、(3)性别、和(4)年龄。遗传变量包括IGF、HOXA13、MDK、CDC、和IL8R的表达分析。遗传+表型模型(“G+P”)意外地表现得比单独的遗传变量或表型变量更好。肉眼可见血尿,或在尿液中发现可视觉识别的血液是膀胱癌患者中的普遍发现。对于那些患者,通常的标准做法是执行附加的诊断程序以诊断膀胱癌。然而,迅速地识别显微可见血尿患者并且理解显微可见血尿在尿路上皮癌方面的含义仍然是一个问题。在本文中,我们提供了改进的方法,用于确定如果呈现了肉眼可见血尿或显微可见血尿的患者患有膀胱癌的概率足够低,以保证不用进行额外的程序,那么这样的患者能否避免侵入性的和昂贵的进一步临床程序以检测尿路上皮癌(UC),包括膀胱癌。描述了归属于高概率尿路上皮癌(UC)的因素。除了环境因素例如吸烟史和职业暴露于芳香胺类之外,人口因素例如性别、种族和年龄明显有助于发展为UC的风险。基于这些因素进行医疗评估的患者的特性在特定的基础上常规使用。例如,广为接受的是呈现血尿的60岁有吸烟史的男性比呈现相同症状的35岁不吸烟的女性具有更高的UC阳性概率,然而尚未对这些差异对于患者患有UC的总概率的贡献进行定量。不同的基因型和表型因素赋予具体的权重并将这些与诊断测试结果组合可以显著增加非侵入性测试诊断能力的精度,并且在由临床和生物标志物的测试结果所限定的患者患有UC的概率基础上提供给临床医生更大的确定性来区分患者。尽管有一些可用于检测膀胱癌存在的方法,但是没有可靠和准确的方法以确定患者是否没有膀胱癌或患有膀胱癌的风险较低。为了解决这一需求,我们开发了新的分析方法,用于在呈现血尿(无论是肉眼可见血尿或显微可见血尿)患者中将癌症疾病和非癌疾病区别开。在本发明的一些方面中,我们将定量表型变量和定量遗传标志物表达进行组合,从而形成联合分离指数(“G+P指数”)以有效地从那些具有高概率UC的AH患者中归类出来具有低概率UC的AH患者。这种分离将那些不需要完整的泌尿病情检查的患者从那些确实需要完整病情检查的患者中做了界定,从而避免了对低概率UC患者进行不必要的病情检查。表型测定在G+P指数中被评价的表型变量包括血尿的频率(HFREQ)、年龄、性别、吸烟史、和红细胞计数(RBC)。这些术语在下文中进行定义。表型变量在本说明书中定义为包括临床发现和观察。基因型测定通常,由PacificEdgeLtd.开发的优选基因型测定包括遗传标志物CDC2、HOXA13、MDK和IGFBP5(“4标志物测定”)的表达的定量。在另一优选测定中,所述4个标志物和第5个标志物IL8R被定量(“5标志物”或测定;新西兰达尼丁的PacificEdgeLtd.的商标)(HolyoakeA,O'SullivanP,PollockR等人:DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes2008;14:742,以及O'SullivanP,SharplesK,DalphinM等人:AMultigeneUrineTestfortheDetectionandStratificationofBladderCancerinPatientsPresentingwithHematuria.JUrol2012,Vol.188No3;746),以及国际专利申请号PCT/NZ2011/000238,标题为“NovelMarkersforDetectionofBladderCancer”。这些出版物和专利申请中的每一个都通过引用完全包含在本说明书中,如同分别地通过引用包含在本说明书中。在优选的实施例中,4标志物测定可以在使用PCR扩增的未分级尿液上实施来定量4个mRNA标志物(CDC2、HOXA13、MDK和IGEBP5),其在尿路上皮癌中被过度表达。IL8R在嗜中性粒细胞被高度地过度表达,因此在非恶性炎性病症下被升高。包含该第5个mRNA标志物显著地降低了移行细胞癌(TCC)的假阳性检测的风险。从患者的角度来看,该测试是非侵入性的并且非常简单。取单一的尿液样本,往往是中段尿液但不排他,这往往在家中而不用进入诊所就可以完成。测定在呈现肉眼可见血尿患者中已表现为比细胞学更加敏感。最值得注意的是,测定对所有大于Ta阶段的尿路上皮癌达到100%(预先指定特异性为85%)的灵敏度,对所有高等级肿瘤的灵敏度为97%。测定归于单一分值,该分值将在患者尿液中体现的5个基因的定量基因表达结合起来。基于患者患有尿路上皮癌的概率,该分值将患者分开为三类。对于呈现血尿的患者(无论是肉眼可见血尿或显微可见血尿),本发明已经被证明通过加入在同一时间段内从患者收集的表型变量加强了这些基因型工具(无论是4标志物测定或测定),并且将这些组合成新的工具,可用于相对于患者患有尿路上皮癌(“UC”)的概率,将患者分开到三个定义的风险级别的指数。本发明的各方面本发明的各方面说明如下。可以理解的是,这些不是本发明的仅有的方面或实施例。普通技术人员可以将一个或多个方面结合在一起以产生另外的方面或实施例。一个方面包括用于确定呈现血尿的患者,或者患有尿路上皮癌的风险级别的方法,其包括:提供所述患者的尿液样本;定量一个值MI,包括定量在所述样本中的人类MDK、CDC2、HOXA13和IGFBP5的表达级别;评估所述患者的表型变量HFREQ、AgeGT、sex、SMK和RBC;根据下述公式中的任一个计算G+P指数:公式(i),G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8),或者公式(ii),G+P指数=(wl*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),或者G+P指数=-8.46+0.79IGF-1.60HOXA+2.10MDK+0.95CDC-0.38IL8R+0.98SNS+0.56Hfreq+1.11Gender+0.64Age;和确定G+P指数是否大于指示所述患者患有尿路上皮癌的风险级别的阈值。另外的方面包括另一个方面的方法,其中所述阈值选自G+P指数值为0至5、6至10、或11至15的组别,其中所述值0到5指示低风险,6至10指示中等风险,并且11至15指示高风险。其它方面包括任何其它方面的方法,其中,如果所述阈值是G+P指数值为6至10,那么所述患者要受到额外的临床测试或实验室测试。仍然进一步的方面包括任何现有方面的方法,其中,如果所述阈值是G+P指数值为11至15,那么所述患者要受到额外的临床测试或实验室测试。仍然进一步的方面包括任何其它方面的方法,其中,如果所述阈值是G+P指数值为0至5,那么所述患者被放在进一步临床测试或实验室测试的观察名单上。另外的方面包括任何其它方面的方法,其中所述阈值是用统计方法建立的。仍然进一步的方面包括任何其它方面的方法,其中所述统计方法是线性判别分析(LDA)、逻辑回归(LogReg)、支持向量机(SVM)、K-5最近邻(KN5N)和划分树分类器(TREE)中的任一项。另外的方面包括任何其它方面的方法,还包括定量选自图6或图7的一个额外的基因型标志物的表达。其它方面包括任何先前方面的方法,其中,定量基因表达的所述步骤通过检测mRNA水平来进行。其它方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测cDNA水平来进行。仍然进一步的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤使用与所述cDNA的至少一部分互补的寡核苷酸来进行。另外的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤使用利用正向引物和反向引物的qRT-PCR法来进行。仍然另外的方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测蛋白水平来进行。仍然其它方面包括任何其它方面的方法,其中,定量基因表达的所述步骤通过检测肽的水平进行的。另外的方面包括任何其它方面的任一个的方法,其中,定量基因表达的所述步骤使用针对所述标志物的抗体来进行。仍然进一步另外的方面包括权利要求1至8或13至15的任一项的方法,其中,定量基因表达的所述步骤使用夹心型免疫测定方法,或使用抗体芯片来进行。仍然进一步的方面包括任何其它方面的任一个的方法,其中,所述定量基因表达使用单克隆抗体来进行。其他方面包括任何其他方面的任一个的方法,其中所述定量基因表达使用多克隆抗血清来进行。G+P指数上述表型变量和基因型变量根据以下关系组合成G+P指数:G+P指数=(w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),其中,HFREQ指的是在6个月周期内每个高倍视野下找到3个或更多红细胞的频率;如果频率低则HFREQ=0,并且如果每个高倍视野下超过3个红细胞则HFREQ=1。AgeGT50指受试者的年龄,如果大于50岁则AgeGT50=1,如果不到50岁则AgeGT50=0。性别男则Gender=1,性别女则Gender=0。SMK指的是受试者是否当前或以前是吸烟者;如果是非吸烟者则SMK=0,如果是吸烟者,则SMK=1。RBC指红细胞计数;如果为25或更多则RBC被设置为1,如果小于25,则RBC为0。MI是遗传标志物MDK、CDC、IGFBP5和HOXA13的表达的组合;如果M1大于4.5,则将其设置为1,如果小于4.5,则M1为0。IL-8指的是IL-8的RNA的表达水平;如果IL-8>2.5则IL-8被设置为1,如果小于2.5,则IL-8为0。符号“*”表示乘法运算符,加权因子w1-w7分别是分配给上面在G+P指数中列出的每个变量的权重。在其它优选的实施例中,(AgeGT50和RBC)可以从模型中去掉,如下所示:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)G+P指数的计算值在0至15之间。G+P指数值为11至15的患者被认为是膀胱癌“高风险”,并且指示了额外的膀胱癌病情检查的需求。G+P指数值为6至10的患者被认为是“中等风险”发展为膀胱癌,并且指示了需要额外的病情检查。G+P指数值为0至5的患者被认为是“低风险”发展为膀胱癌。“低风险”组的病人被放在观察等待名单上,如果额外的症状出现,或者显微可见血尿反复发生,则他们为可能的进一步病情检查被重新评估。如在示例3(图18和图19)中更充分地说明的,我们发现,单独的定量表型变量的ROC曲线生成适度水平的诊断能力。单独的定量基因型标志物的ROC曲线生成显著水平的诊断能力。当基因型变量和表型变量组合成G+P指数时,我们发现了出乎意料地更好的诊断能力。定量基因表达蛋白质或核酸(或者单独地或者彼此组合地)由细胞分泌或来自细胞分裂,或者通过细胞凋亡机制丧失,其具有作为血清或体液标志物来诊断疾病(包括膀胱的炎性疾病和/或膀胱癌)的功用,或者作为标志物监测确诊疾病的进展。蛋白质和细胞标志物的检测可以使用本领域中已知的方法来进行,并且包括使用RT-PCT,qRT-PCR,单克隆抗体,多克隆抗血清等。具体地,本发明提供了用于归类呈现血尿(无论是肉眼可见血尿或显微可见血尿)患者的方法,包括:(i)提供生物样本;(ii)检测所述样本中的一种或多种膀胱肿瘤标志物(BTM)。特别关注的膀胱肿瘤标志物包括MDK、CDC2、HOXA13和IGFBP5(“4标志物测定”)。可选地,也可以检测所述样本中的人类嗜中性粒细胞标志物白细胞介素8受体(IL8Rb)的水平(测定)。癌症的存在可以通过与正常患者、患有早期膀胱癌的患者、和/或患有炎性疾病的患者比较所述一个或多个BTM的水平来确认。例如,癌症的存在可通过对比BTM的表达和表达阈值来确认。阈值可以大约是表达水平至少是没患有癌症患者组的表达水平的1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9或10、100、1000或高达10,000倍。在其它方面,IL8Rb的高表达,但没有膀胱肿瘤标志物的改变的表达可以指示炎性疾病,而不是癌症。本发明的方法可以与用于检测膀胱癌的任何合适的标志物联合使用。用于本发明的合适的标志物的示例在图6或图7中概述。本发明包括使用在图6或图7中概述的标志物中的任何一个或多个。可选地,在其它优选的实施例中,本发明可以包括IL8Rb与标志物MDK、CDC2、HOXA13和IGFBP5的一个或多个的任意组合,该组合还可以与适合于检测膀胱癌的一个或多个其他标志物(例如,在图6或图7中概述的任何一个或多个标志物)组合。尤其是,本发明包括标志物的任何一种或多种组合的表达的定量,这些组合为:IL8Rb/MDK,IL8Rb/CDC2、IL8Rb/HOXA13、IL8Rb/IGFBP5,IL8Rb/MDK/CDC2、IL8Rb/MDK/HOXA13、IL8Rb/MDK/IGFBP5、IL8Rb/CDC2/HOXA13、IL8Rb/CDC2/IGFBP5、IL8Rb/HOXA13/IGFBP5、IL8Rb/MDK/CDC2/HOXA13、IL8Rb/MDK/CDC2/IGFBP5、IL8Rb/CDC2/HOXA13/IGFBP5、和IL8Rb/MDK/CDC2/HOXA13/IGFBP5。这些组合可选地包括适合于检测膀胱癌的一个或多个其他标志物,例如在图6或图7中概述的标志物中的任何一个或多个。本发明还提供了用于检测膀胱的炎性病症的方法,包括:(i)提供来自患者的生物样本;和(ii)检测所述样本中的人类嗜中性粒细胞标志物白细胞介素8受体(IL8Rb)的水平。膀胱的炎性病症的存在通过与正常患者、呈现血尿患者和患有炎性膀胱病症的患者的IL8Rb的水平进行比较来确认。例如,膀胱的炎性病症的存在可通过比较标志物IL8Rb的表达和阈值来确认。阈值可以大约是表达水平至少是另一组患者的表达水平的1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10、100、1000或高达10,000倍。本发明的优选的基因型方法可通过检测基因表达的任何合适的标志物来进行,例如利用任何合适的方法确定mRNA、cDNA、蛋白质或肽的水平。诊断的确认可以通过使用分类器系统来建立,例如线性判别分析(LDA)、逻辑回归(LogReg)、支持向量机(SVM)、K-5最近邻(KN5N),和划分树分类器(TREE)。附图说明本发明是参考其具体实施例,并且参照附图进行说明的,其中:图1描绘了IL8Rb的蛋白和mRNA序列(也称为CXCR2)。图2描绘了散点图,其示出IL8Rb对从非恶性疾病(前列腺疾病,膀胱炎,尿路感染和尿石症)中分开TCC的效果。IL8Rb已替代了图2c和图2f中的不同的膀胱癌RNA标志物。(a)MDK/IGFBP5;(b)MDK/HOXA13;(c)MDK/IL8Rb;(d)CDC2/IGFBP5;(e)CDC2/HOXA13;(f)CDC2/IL8Rb。图3描绘了ROC曲线分析(灵敏度VS特异性),其示出将IL8Rb包括在使用线性判别分析(LD)和线性回归(LR)导出的诊断算法中的效果。ROC曲线是从患有TCC和上尿路癌症的患者(n=61),和患有非恶性疾病膀胱炎、尿路感染和尿路结石的患者(n=61)导出的。(a)LD1(实线)和LD2(虚线)。(b)LR1(实线)和LR2(虚线)。IL8Rb被包括在LD2和LR2中。图4描绘了延长的ROC曲线分析,其示出将IL8Rb包括在使用线性判别分析(LD)和线性回归(LR)导出的诊断算法中的效果。该ROC曲线是从TCC患者(n=56)和,不同于图3,队列中的任何非恶性疾病患者(n=386)导出的。(a)LD1(实线)和LD2(虚线)。(b)LR1(实线)和LR2(虚线)。IL8Rb被包括在LD2和LR2中。图5描绘了箱形图,其示出非恶性泌尿疾病患者的尿中IL8RbmRNA的累积。RNA已经通过使用delta-Ct方法的qRT-PCR被定量(Holyoake等人,2008)。用此方法,较低的Ct反映较高的RNA水平。BPH:良性前列腺增生症;UTI:尿路感染;NSprostate:非特异性前列腺疾病;Vasc.Prostate:前列腺血管;warfarin:血尿继发于华法林的使用。对膀胱炎/UTI患者的观察是与所示的其它非恶性情况显著不同的(p=0.001)。图6描绘了已知在膀胱癌中被过度表达的标志物,并且该标志物是适合于在本发明中使用的。图7描绘了已知在膀胱癌中被低估表达的标志物,并且该标志物是适合于在本发明中使用的。图8描绘了实施例2的患者招募程序和数量的流程图。图9描绘了患病3个月患者的基线临床和人口统计特征。图10描绘了尿液测试的总体灵敏度和特异性。图11描绘了各种ROC曲线;图11a描绘了NMP22ELISA和uRNA-D的ROC曲线(测试包括四个标志物MDK+CDC2+IGFBP5+HOXA13);图11b描绘了五个标志物MDK、CDC2、HOXA13、IGFBP5和IL8Rb的ROC曲线。图12描绘了尿检对阶段、等级、肿瘤部位、肿瘤的多重性、血尿状态、尿液样本的肌酸酐和性别的敏感度。表格显示了TCC患者中尿检呈阳性的数目和百分比。图13描绘了尿检对诊断、肉眼可见血尿或肌酸酐和性别的特异性。表格显示了无TCC患者中尿检呈阴性的数目和百分比。图14描绘了采用五种不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)的下述标志物组合的ROC曲线:(a)MDK、(b)CDC、(c)IGFBP5、(d)HOXA13、(e)MDK+CDC2、(f)MDK+IGFBP5、(g)MDK+HOXA13、(h)CDC2+IGFBP5、(i)CDC+HOXA13、(j)IGF+HOXAI3、(k)MDK+CDC2+IGFBP5、(l)MDK+CDC2+HOXA13、(m)MDK+IGFBP5+HOXA13、(n)CDC2+IGFBP5+HOXA13、(o)MDK+CDC2+IGFBP5+HOXA13,加上或减去IL8Rb。图15描绘了灵敏度选择性研究的结果。图15a描绘了图14中ROC曲线的高达20%的假阳性率(80%的特异性)的“曲线下面积”(AUC),且图15b示出了源自于加入IL8Rb的AUC的差异。图16描绘了采用五种不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)、不同组特异性(a)80%,(b)85%,(c)90%,(d)95%,(e)98%的四个标志物MDK、CDC2、IGFBP5和HOXA13,加上或减去IL8Rb的组合的灵敏度的图表。图17描绘了在不同组特异性(a)80%,(b)85%,(c)90%,(d)95%,(e)98%增加IL8Rb时灵敏度的增益,并且在不同组特异性(f)80%,(g)85%,(h)90%,(i)95%,(j)98%增加IL8Rb时灵敏度的所得增益。图18描绘了用于测试使用单独的基因测试、单独的表型评价、和/或同时使用基因测试和表型评价来研究的具有血尿患者的ROC曲线。图19描述了本发明的变量,性别、吸烟史和HFREQNEW的比值比(横轴)的图表。图20A和图20B描绘了报告诊断准确性的标准的流程图。图20A描绘本研究中所有三个队列中肉眼可见血尿患者的流程图。图20B描绘了报告包括在本研究中的显微可见血尿患者的诊断准确性的流程图。图21描绘了代表三个分类模型的ROC曲线。P指数(点线),G指数(虚线)和G+P指数(实线)。图22描绘了根据每个模型NPV对血尿检测阴性的患者的比例。P指数(点线),G指数(虚线),和G+P指数(实线)。图23描绘了检测结果(横轴)对归类结果(纵轴)之间的关系的图表。图24描绘了G2指数(横轴)对G1+P指数(纵轴)的图表。具体实施方式定义在详细说明本发明的实施例之前,提供本说明书中所使用的一些术语的定义是有用的。术语“标志物”指与生物现象的存在定量地或定性地相关联的分子。“标志物”的示例包括多核苷酸,例如编码或非编码的基因或基因片段,编码或非编码的DNA或DNA片段、RNA或RNA片段;或基因产物,包括多肽,例如肽,寡肽,蛋白或蛋白片段;或与位于所述现象之下的机制直接地或间接地相关的任何相关的代谢产物,副产物,或任何其他识别分子,例如抗体或抗体片段。本发明的标志物包括如本文所公开的核苷酸序列(例如,基因库序列),特别是,全长序列,任何编码序列,任何片段,任何可能的探针(例如,跨越外显子—外显子边界创建的),其中包括捕获基序,发夹结构或荧光团,或其任何补充物,以及如上述所定义的任何可测量的标志物。如本说明书所用的“抗体”和类似术语是指免疫球蛋白分子和免疫球蛋白(Ig)分子的免疫活性部分,即含有与抗原特异性结合(免疫发生反应)的抗原结合位点的分子。这些包括,但不限于,多克隆、单克隆、嵌合、单链、Fc片段、Fab片段、Fab'片段和Fab2片段以及Fab表达库。抗体分子涉及IgG、IgM、IgA、IgE和IgD类中的任何一种,它们通过存在于分子中的重链的性质彼此不相同。这些也包括子类,例如IgG1、IgG2等等。轻链可以是kappa链或lambda链。本说明书中提及的抗体包括涉及所有类、子类和类型。还包括嵌合抗体,例如,特定于多个源的其单克隆抗体或其片段,例如,老鼠或人类序列。此外还包括骆驼抗体,鲨鱼抗体或纳米抗体。术语“癌症”和“癌的”指或描述哺乳动物的生理疾病,其特征典型地为异常或失调的细胞生长。例如,癌症和癌症病理可以与以下状况相关,例如,具有转移邻近细胞的正常功能,与邻近细胞的正常功能相干扰,细胞激素或其他分泌产物的释放水平异常,炎性或免疫反应的抑制或加重,瘤样病变,恶性肿瘤前照,恶性肿瘤,周围或远处组织或器官的侵入,例如淋巴结,等等。术语“肿瘤”是指所有肿瘤细胞生长和增殖,无论是恶性的或良性的,以及所有的癌前和癌变细胞和组织。术语“膀胱癌”是指产生于膀胱的肿瘤。这些肿瘤能够转移到任何器官。术语“BTM”或“膀胱肿瘤标志物”或“BTM家族成员”是指与尿路上皮癌、膀胱癌、膀胱移行细胞癌(TCC)、鳞状细胞癌和膀胱腺癌相关联的肿瘤标志物(TM)。术语BTM还包括单个标志物的组合,其组合提高了检测膀胱癌的敏感性和特异性。但是应当理解,术语BTM并不要求所述标志物仅对于膀胱肿瘤是特异性的。相反,BTM的表达可以在其它类型的细胞、患病细胞、肿瘤,包括恶性肿瘤中被改变。术语“低估表达BTM”是指标志物,其在膀胱肿瘤中展现的表达比在非恶性膀胱组织中低。术语“过度表达BTM”是指标志物,其在膀胱肿瘤中展现的表达比在非恶性膀胱组织中高。术语“差异表达的”,“差别表达”和类似的短语,指的是相对于其在控制受试者(例如对照样本)中的表达,其表达在患病(特别是癌症,例如黑色素瘤)的受试者(例如测试样本)中被激活至较高或较低的水平的基因标志物。该术语还包括其表达在相同疾病的不同阶段;在具有良好或不良的预后的疾病;或在有较高或较低水平的增殖的细胞中被激活至较高或较低的水平的标志物。差异表达的标志物可能在多核苷酸水平或多肽水平被激活或被抑制,或者可能受到选择性剪接以产生不同的多肽产物。例如,此类差异可以通过mRNA水平的变化、表面表达、分泌或多肽的其他分区来证明。差异表达可以包括两个或更多个标志物(例如,基因或其基因产物)之间的表达的对比;或两个或更多个标志物之间的表达的比例的对比(例如,基因或其基因产物);或在相同标志物的两种不同的加工产物(例如,转录物或多肽)之间的对比,该相同标志物在正常受试者和患病受试者之间;或在同一疾病的不同阶段之间;或在具有良好或不良预后的疾病之间;或在具有较高和较低水平的增殖的细胞之间;或在正常组织和病变组织(特别是癌症,或黑素瘤)之间的不同。差异表达包括例如正常和患病细胞,或已经历不同疾病事件或疾病阶段的细胞中,或具有不同程度增殖的细胞中的基因或其表达产物中的暂存的表达模式或细胞表达模式中定量及定性的差异。术语“表达”包括生成多核苷酸和多肽,特别是,由基因或基因的一部分生成RNA(例如,mRNA),并且包括生成由RNA或基因或基因的一部分编码的多肽,以及与表达相关联的可检测材料的出现。例如,从多肽—多肽相互作用,多肽—核苷酸相互作用,或类似物形成复合物,包括在术语“表达”的范围内。另一个示例是配基(例如杂交探针或抗体)与基因或其他多核苷酸或寡核苷酸、多肽或蛋白片段的结合,以及配基的可视化。因此,微阵列上、杂交印记(例如Northern印迹)上,或在免疫印迹(如Western印迹)上,或珠阵列上,或通过PCR分析的点的强度,包括在构成其基础的生物分子的术语“表达”内。术语“基因表达阈值”,和“限定的表达阈值”可互换使用并且是指所讨论的标志物的水平,在该水平外,多核苷酸或多肽的表达水平用作患者疾病的预测标志物。例如,高于某个阈值的IL8Rb的表达是诊断患者患有炎性病症的。使用膀胱癌标志物检测疑似膀胱癌患者时,也可以使用阈值。高于阈值的表达水平表示该患者患有炎性膀胱疾病,容易造成癌症的假阳性测试,而低于阈值的IL8Rb的表达水平预示该患者没患有炎性膀胱疾病。通过包含IL8Rb的测量,如果IL8Rb的水平低于阈值,那么来自膀胱肿瘤标志物的表达的任何结果都可被信赖(即阳性结果很可能对患有癌症的病人是阳性的,而不是实际上从发炎粘膜的非恶性细胞的剥落造成的膀胱癌标志物的水平增加)。术语“诊断阈值”指的是一个阈值,根据这个阈值,患者可以说已经被诊断患有或没患有指定的疾病,例如膀胱癌。诊断阈值根据多种因素,例如人口、患病率以及可能的临床结果,通常被设定为达到期望的灵敏度和特异性。通常,诊断阈值可以使用算法,和/或计算机化的数据分析来计算和/或确定。确切的阈值将取决于人口以及任何被用来预测疾病的模型(预测模型)。阈值是从如在下面示例中所述的临床研究中用试验方法确定的。取决于所使用的预测模型,表达阈值可以被设定为达到最大灵敏度,或针对最大特异性设定,或者针对最小误差(最大分类率)设定。例如较高的阈值可以被设定为达到最小误差,但是这可能会导致较低的灵敏度。因此,对于任何给定的预测模型,临床研究将被用于设定表达阈值,其通常达到最高灵敏度同时具有最小误差率。通常,该阈值可能大约是在…的表达(注:此处表达不完全,说明书第16页倒数第二段末尾)术语“灵敏度”指的是患有某种疾病的个体(由模型)测试为阳性的比例。因此,提高的灵敏度意味着更少的假阴性测试结果。术语“特异性”是指没患有某种疾病的个体(由模型)测试为阴性的比例。因此,提高的特异性意味着更少的假阳性测试结果。术语“接受者操作特性”(“ROC曲线”)指对于特定标志物或测试不同切断点的真阳性率(灵敏度)对假阳性率(特异性)的曲线图。ROC曲线上的每个点代表特定的灵敏度/特异性点,其将对应给定的阈值。ROC曲线对于建立阈值以得到所期望的结果是重要的。ROC曲线下的面积表示(表达为曲线下面积(AUC)分析,可以是给定的标志物或由多个标志物组成的测试如何的度量,其可以区分两个或更多诊断结果。ROC曲线也可以用来比较两个不同测试的准确性。术语“寡核苷酸”是指多核苷酸,通常是探针或引物,包括但不限于单链脱氧核糖核苷酸,单链或双链核糖核苷酸,RNA:DNA杂交体,和双链DNA。寡核苷酸,如单链DNA探针寡核苷酸,通常通过化学方法(例如使用可商购的自动寡核苷酸合成仪),或通过各种其他方法合成,包括体外表达系统,重组技术,以及在细胞和有机体中的表达。术语“过度表达”或“过度表达的”是指高于在正常组织中可见的患者的基因或标志物的表达水平。如果该表达是正常组织中或另一组患者的组织中的表达的1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,10,100,1000,或高达10,000倍,那么该表达可被认为是过度表达的。术语“多核苷酸”,在单数或复数使用时,一般是指任何多核糖核苷酸或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA。这包括,但不限于,单链和双链DNA,包括单链和双链区域的DNA,单链和双链RNA,和包括单链和双链区域的RNA,包含可以是单链或,更典型地,双链或包括单链和双链区域的DNA和RNA的杂交分子。还包括的是包含RNA或DNA或RNA和DNA两者的三链区域。特别包括的是mRNA,cDNA,和基因组DNA,和任何它们的片段。该术语包括含有一个或多个修饰的碱基,例如氚化碱基,或不寻常的碱基,如肌苷的DNA和RNA。本发明的多核苷酸可以包括编码或非编码序列,或者有义或反义序列。应当理解的是,在本说明书中每个引用“多核苷酸”或类似的术语,将包括全长序列以及其任何片段,衍生物或变体。术语“表型”是指在临床环境中,或在临床交谈中,或在病人的病史中可观察的特征。当用于计算G+P指数的公式中,“表型”或“P”是指患者的年龄,性别,血尿的发生率,和吸烟史。“多肽”,如在本说明书中所使用,是指寡肽,肽,或蛋白序列,或其片段;以及天然存在的,重组的,合成的或半合成的分子。当“多肽”在本说明书中列举以指天然存在的蛋白分子的氨基酸序列时,“多肽”和类似的术语并不意味着限制氨基酸序列为全长分子的完整天然氨基酸序列。应当理解的是,在本说明书中每个引用“多肽”或类似的术语,将包括全长序列,以及其任何片段,衍生物或变体。术语“qPCR”或“QPCR”是指例如在PCRTechnique:QuantitativePCR,J.W.Larrick,ed.,EatonPublishing,1997,和A-ZofQuantitativePCR,S.Bustin,ed.,IULPress,2004中描述的定量聚合酶链反应。术语“逆转录”是指一个过程,在其中,包括信使RNA(“mRNA”)的寡核糖核苷酸被用作使用酶(“逆转录酶”)的互补寡脱氧核糖核苷酸(“cDNA”)的生化合成的模板,该酶结合到模板RNA,并且催化一系列加成反应,该加成反应依次附接脱氧核苷酸碱基,以形成与RNA模板互补的寡脱氧核糖核苷酸链。术语“血尿”被定义为尿液中存在血液。它可以表现为尿液中的肉眼可见血尿(血细胞的可视痕迹),或显微可见血尿(血液的微观痕迹)。显微可见血尿的确认指示被定义为在至少3个妥善收集的尿样上每个显微镜高倍视野(HPF)下呈现3个或更多个血细胞。显微可见血尿也可以在诊所通过尿液试纸(比色对比估计)进行检测。血尿(显微的或肉眼的)可以无症状(没有伴有血尿的其他症状)或有症状。其他症状包括尿痛(排尿疼痛),膀胱排空不完全的感觉或增加的频率或排尿。杂交反应的“严格性”是本领域的普通技术人员容易确定的,并且通常是取决于探针长度,洗涤温度,和盐浓度的经验计算。通常,较长的探针需要较高的温度进行适当的退火,而较短的探针需要较低的温度。当互补链存在于低于其解链温度的环境中时,杂交通常取决于变性DNA重新退火的能力。所述探针和可杂交序列之间的预期同源性程度越高,可使用的相对温度越高。其结果是,随之而来的较高的相对温度将趋向于使反应条件更为严格,而较低温度将趋向于使反应条件较为不严格。额外的细节和杂交反应的严格性的解释可在例如Ausubel等人,CurrentProtocolsinMolecularBiology,WileyIntersciencePublishers,(1995)中找到。“严格条件”或“高严格条件”,如本说明书中所定义的,典型地:(1)采用低离子强度和高温用于洗涤。例如在50℃的0.015M氯化钠/0.0015M柠檬酸钠/0.1%十二烷基硫酸钠;(2)在杂交过程中采用变性剂,如甲酰胺,例如,50%(体积/体积)甲酰胺与0.1%牛血清白蛋白/0.1%细胞分层液/0.1%聚乙烯吡咯烷酮/50mM磷酸钠,pH值为6.5的缓冲液与在42℃的750mM氯化钠,75mM柠檬酸钠;或(3)采用50%甲酰胺,5XSSC(0.75M氯化钠,0.075M柠檬酸钠),50mM磷酸钠(pH值为6.8),0.1%焦磷酸钠,5X,邓波特溶液,超声处理的鲑鱼精子DNA(50ug/ml),0.1%SDS(十二烷基硫酸钠)和在42℃的10%硫酸葡聚糖,与在42℃的0.2XSSC(氯化钠/柠檬酸钠)和在55℃的50%甲酰胺中洗涤,随后用包括在55℃的含有EDTA(乙二胺四乙酸)的0.1XSSC(氯化钠/柠檬酸钠)中高严格性洗涤。“中等严格条件”可以被识别为如在Sambrook等人,MolecularCloning:ALaboratoryManual,NewYork:ColdSpringHarborPress,1989中所描述的,并且包括对比上文描述的,较为不严格地使用洗涤溶液和杂交条件(例如,温度,离子强度和%SDS(十二烷基硫酸钠))。中等严格条件的一个示例是于37℃在溶液中的过夜培养,溶液包括:20%甲酰胺,5XSSC(150mM氯化钠,15mM柠檬酸三钠),50mM磷酸钠(pH值为7.6),5X邓波特溶液,10%硫酸葡聚糖,和20mg/ml变性剪切的鲑鱼精子DNA,接着在约37-50℃的1XSSC(氯化钠/柠檬酸钠)中清洗过滤器。本领域技术人员将认识到如何根据需要调整温度,离子强度等以适应如探针长度等因素。术语“IL8Rb”是指嗜中性粒细胞标志物白介素8受体B(也称为趋化因子(C-X-C基序)受体2[CXCR2])(图1;序列号1和2),并且包括标志物IL8Rb。该术语包括多核苷酸,例如基因或基因片段,RNA或RNA片段;或基因产物,包括多肽,如肽,寡肽,蛋白或蛋白片段;或任何相关的代谢产物,副产物,或任何其他识别分子,如抗体或抗体片段。术语“可靠性”包括假阳性和/或假阴性的低发生率。因此,标志物的可靠性越高,与使用该标志物作出诊断相关联的假阳性和/或假阴性越少。“精度”是真实的结果(真阳性加真阴性)除以群体中的总病例数的比例,根据公式:术语“归类(triage)”是指从那些具有合理概率患有膀胱癌以及需要进一步的临床病情检查,包括膀胱镜检查或其他临床程序的血尿患者中区分出具有低概率患有膀胱癌的血尿患者。实施例因此,在某些优选的实施例中,提供了遗传标志物和表型标志物的组合,其允许从那些具有足够风险患有膀胱癌以授权进一步的临床病情检查,可能包括膀胱镜检查或其他程序的患者中区分出具有低概率患有膀胱癌的患者。在其他实施例中,提供了标志物,其有大于约70%的可靠性;在其他实施例中,大于约73%的可靠性,仍然在其他实施例中,大于约80%的可靠性,又在进一步的实施例中,大于约90%的可靠性,在还有一些实施例中,大于约95%的可靠性,又在进一步的实施例中,大于约98%的可靠性,以及在某些实施例中,约100%的可靠性。对于遗传分析,除非另有指明,本发明的实践将采用分子生物学(包括重组技术),微生物学,细胞生物学和生物化学的常规技术,这些技术是在本领域的技术范围内的。这些技术在以下文献中有充分解释,例如,MolecularCloning:ALaboratoryManual,2ndedition,Sambrook等人,1989;OligonucleotideSynthesis,MJGait,ed.,1984;AnimalCellCulture,R.I.Freshney,ed.,1987;MethodsinEnzymology,AcademicPress,Inc.;HandbookofExperimentalImmunology,4thedition,D.M.Weir&CC.Blackwell,eds.,BlackwellScienceInc.,1987;GeneTransferVectorsforMammalianCells,J.M.Miller&M.P.Calos,eds.,1987;CurrentProtocolsinMolecularBiology,F.M.Ausubel等人,eds.,1987;以及PCR:ThePolymeraseChainReaction,Mullis等人,eds.,1994。应当理解的是,上述术语可以指蛋白,DNA序列和/或RNA序列。也可以理解的是,上述术语也指具有如本说明书中所描述的同源序列的非人类蛋白质,DNA和/或RNA。本发明的实施例通常泌尿科医生所指的血尿患者预约在专门血尿门诊就诊。肉眼可见血尿的患者往往优先于那些显微可见血尿的患者。来自于初级保健提供者转诊时提供的信息可以是高度可变的,这使得依据患有尿路上皮癌的概率来精确分层患者是困难的。通常在患者就诊前,尿细胞学是常规地被要求的,并且如果为阳性,将增加患者接受完整的临床病情检查的优先权,但是虽然尿细胞学有时具有高度特异性,但是却具有非常低的敏感性,因此凭借其高假阴性率(6),具有很低的实用价值。没患有膀胱癌的血尿患者的表型和基因型分析G+P指数上述表型和基因型变量是根据以下关系组合成G+P指数的:G+P指数=(w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC)+(w6*M1+w7*IL-8),其中,HFREQ代表在6个月周期内每个高倍视野下找到3个或更多个红细胞的频率;如果频率低,则HFREQ=0,并且如果每个高倍视野下超过3个红细胞,则HFREQ=1,AgeGT50是指受试者的年龄,如果大于50岁,则AgeGT50=1,如果不到50岁,那么AgeGT50=0。性别男性为1,性别女性为0。SMK指受试者是否当前或以前是吸烟者;如果为非吸烟者则SMK=0,如果为吸烟者,则SMK=1。RBC指红细胞计数;如果为25个或更多,则RBC设置为1,而如果小于25,则RBC为0。MI是遗传标志物MDK,CDC,IGFBP5和HOXA13的表达的组合;如果M1>4.5,则将其设置为1,如果小于4.5,则将其设置为0。IL-8指IL-8的RNA的表达水平;如果IL-8>2.5,则IL-8被设置为1,如果IL-8<2.5,则IL-8=0。符号“*”表示乘法运算符,并且加权因子w1—w7分别为分配给上面在G+P指数中列出的每个变量的权重。在其它优选的实施例中,(AgeGT50和RBC)可以从模型中去掉,如下所示:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)G+P指数的计算值在0至15之间。G+P指数值为11至15的患者被认为是膀胱癌“高风险”的,并且指出了额外的膀胱癌病情检查的需求。G+P指数值为6至10的患者被认为是“中等风险”发展为膀胱癌并且指示了需要额外的病情检查。G+P指数值为0至5的患者被认为是“低风险”发展为膀胱癌。“低风险”组的患者被放置在观察等待名单上,如果其他症状出现,或者如果显微可见血尿反复发生,则他们为可能的进一步病情检查被重新评估。对区分没患有和患有膀胱癌的患者有用的基因型变量包括RNA标志物“M1”的表达,“M1”是MDK,CDC,IGFBP5(IGBP5),和HOXA13的组合。另一个基因型变量是IL8R的RNA的表达。这些基因型变量的系数示于下面的表7中。4.5和2.5分别为M1和IL8R的阈值,并且分别分配了系数5和2。G+P指数的计算结果为0至15之间的一个值。G+P指数值为11至15被认为是膀胱癌“高风险”的,并且指出了额外的膀胱癌病情检查的需求。G+P指数值为6至10被认为是“中等风险”发展为膀胱癌并且指示了需要额外的病情检查。G+P指数值为0至5被认为是“低风险”发展为膀胱癌,并且这些患者被放置在等待名单上,如果其他症状出现,或者如果显微可见血尿反复发生,则他们为可能的全面病情检查被重新评估。如在示例3(图18和19)中更充分地描述的,我们发现,单独的表型数据的ROC曲线生成适度水平的诊断能力。单独的基因型数据的ROC曲线生成显著水平的诊断能力。当基因型数据和表型数据组合成G+P指数时,我们发现了出乎意料地更好的诊断能力。没患有膀胱癌的患者的遗传分析在一些优选的实施例中,本发明结合使用4标志物测定或测定(基因型变量)和五个主要风险因素(表型变量)中的一个或多个,以生成可用于归类显微可见血尿或肉眼可见血尿患者在患有尿路上皮癌的潜在风险方面的选择指数。虽然不排除灵活的膀胱镜检查的必要性,但基于表型变量和基因型变量被认定为具有尿路上皮癌高风险的患者可以更早就诊,可能全面改善患者的结果。基因型标志物可以作为工具用于检测无癌患者或选择患有疾病的低,中或高风险的患者组别。标志物可以,例如,在疾病组织和相应的非疾病组织之间差异表达。在这种情况下,差异表达的检测与疾病的存在相关联。可替代地,标志物可以直接与出现在疾病组织的变化,或疾病造成的变化相关联。炎性疾病与嗜中性粒细胞的增加相关联。已经发现的是,嗜中性粒细胞标志物白介素8受体B(IL8Rb;图1;序列号1和2),可以为样本中存在嗜中性粒细胞提供良好的标志物,并且因此可用作诊断标志物用于检测样本中的炎性疾病,特别是,检测炎性膀胱疾病。如图5所示,尿液中IL8Rb的累积指示炎性膀胱疾病的存在。具体而言,图5示出患有疾病的患者的尿液中IL8Rb的累积;良性前列腺增生,泌尿道感染,非特异性前列腺疾病,血管前列腺和继发于华法林的使用。然而,可以理解的是,IL8Rb的使用并不限于只检测这些疾病,但是这些示例表明,IL8Rb确实在患有膀胱炎性疾病的患者的样本中增加。也就是说,IL8Rb可以用作与膀胱疾病相关联的炎症的标志物,因此适合于用来检测与炎症相关联的任何疾病。因此,检测IL8Rb的量可以用作膀胱炎性疾病的标志物。更特别地是,IL8Rb可用于检测与嗜中性粒细胞的累积相关联的炎性膀胱疾病。对TCC的尿检很大程度上依赖于尿液中存在从脱落的肿瘤细胞获得的标志物。检测这些细胞的能力可以被大量的污染细胞,如血液和炎性细胞的存在所掩盖。此外,膀胱内膜的炎症可以导致非恶性细胞从黏膜脱落的增加。结果是,使用从膀胱移行细胞获得的标志物的尿检具有较高的可能性对取自患有膀胱炎,尿路感染或其他疾病导致的泌尿道炎症或移行细胞剥落,如尿路结石,的患者的尿样给出假阳性结果(Sanchez-Carbayo等人)。避免这样的假阳性结果的一种方式是选择在血液或炎症细胞中表达相对较低的标志物。使用这样的标志物的结果是在呈现非恶性,炎症性疾病的TCC患者中较少的假阳性。然而,在血液学来源的细胞中低表达的标志物未能弥补非恶性移行细胞脱落的增加率。已经被发现的是,来自发炎组织的所剥离的移行细胞对膀胱癌尿检精度的负面影响,可以通过改进泌尿道炎性病症患者的鉴定来最小化。这里,已经令人惊奇地发现,使用标志物IL8Rb与一种或多种膀胱肿瘤标志物(BTM’s)相结合提供了对于膀胱癌的更精确的检测。特别是,对于膀胱癌的基于标志物的检测,其包括标志物IL8Rb,是假阳性结果的可能性更低,这会导致患者患有炎性非癌病症的结果。一般来说,炎性病症存在或不存在由具有基因表达的阈值来确认,高于该阈值的IL8Rb的表达指示炎性病症。例如,IL8Rb的表达高于某个阈值是诊断患者患有炎性病症(见上文所描述的阈值)。当IL8Rb与预测膀胱癌存在的一个或多个标志物结合使用时,膀胱肿瘤标志物的升高的表达的存在和IL8Rb的表达高于某一阈值,可以预测患者患有炎性病症而不是癌症。此外,如果测试是对于患者的尿液进行的,那么该结果可以预测患者患有炎性膀胱疾病。膀胱肿瘤标志物的高水平最有可能是作为炎症结果的来自黏膜的非恶性细胞的结果。也就是说,患者虽然具有高水平的膀胱肿瘤标志物,但实际上没患有膀胱癌——即假阳性。可替代地,如果患者具有一种或多种膀胱肿瘤标志物的异常高水平或诊断水平,但是IL8Rb的水平低于阈值,则患者可能患有癌症,尤其是膀胱癌或尿路上皮癌。如果测试是对于来自患者的尿液进行的,则尤其是这样。这个结果对于健康服务提供者是显著有利的,因为他们可以肯定患者确实患有癌症,并且可以立即开始治疗,而不必担心该结果实际上是由给出假阳性结果的炎症疾病导致的。已经令人惊讶地表明,来自编码嗜中性粒细胞标志物白介素8受体B(IL8Rb)的基因的RNA的定量提高了使用公知的TCC或BTM标志物检测TCC患者的整体表现。IL8Rb的参考序列示出于图1和序列号1和2)。除了其在TCC检测中的作用,还探索了IL8Rb是否可以用作尿液标志物以帮助炎性疾病的诊断(图5)。使用IL8Rb标志物可以利用用于检测基因表达水平的已知方法,单独用于检测膀胱的炎性病症。用于检测基因表达的方法的示例概述如下。可替代地,IL8Rb可以与多个BTM中的一个相结合,以检测膀胱癌。已被示出,通过利用炎性疾病标志物IL8Rb作为测试膀胱癌的一部分,发炎组织对创建假阳性结果的影响被最小化。标志物IL8Rb可以与任何膀胱癌标志物联合使用,或者可替代地可以与两个或更多个标志物一起使用,作为特征的一部分,用于检测膀胱癌。减少假阳性结果的数量是指更少的没患有膀胱癌的患者经受可能不必要的程序,包括膀胱镜检查,该检查本身就有风险。减少假阴性结果的数量意味着膀胱癌患者更有可能被检测出,并因此对癌症进行进一步评估。IL8Rb改善膀胱癌检测结果的作用来自将患有非恶性疾病和膀胱癌的患者分开的能力。做到这一点,因为IL8Rb的增加指示样本中增加的嗜中性粒细胞的存在。因此,IL8Rb的能力不依赖于所使用的膀胱肿瘤标志物。如图2和图12至图15所示,当与多种膀胱肿瘤标志物和膀胱肿瘤标志物的组合相结合时,IL8Rb有增加标志物的能力的特异性的总体效果,以检测受试者的癌症。根据本发明的一个特征的示例是将IL8Rb与MDK,CDC2,IGFBP5和HOXA13结合使用,其也可以与适于检测膀胱癌的一个或多个其它标志物结合,例如图6或图7中列出的多个标志物中的任一项。如在图14和图15中所示,IL8Rb可以用在标志物的任意组合中,特别是组合IL8Rb/MDK,IL8Rb/CDC2,IL8Rb/HOXA13,IL8Rb/IGFBP5,IL8Rb/MDK/CDC2,IL8Rb/MDK/HOXA13,IL8Rb/MDK/IGFBP5,IL8Rb/CDC2/HOXA13,IL8Rb/CDC2/IGFBP5,IL8Rb/HOXA13/IGFBP5,IL8Rb/MDK/CDC2/HOXA13,IL8Rb/MDK/CDC2/IGFBP5,IL8Rb/CDC2/HOXA13/IGFBP5和IL8Rb/MDK/CDC2/HOXA13/IGFBP5。如图14和图15所示,IL8Rb的加入增加了标志物或标志物组合准确地诊断受试者的膀胱癌的能力。本发明不限定于这些特定的组合,但是可任选地包括适于检测膀胱癌的一种或多种其它标志物,例如图6或图7中列出的多个标志物中的任一项。下面表1显示了特异性标志物MDK,CDC2,IGFBP5和HOXA13和IL8Rb的标识。表1:膀胱肿瘤标志物的标识图2至图4和图12至图17示出了将IL8Rb与四个已知的有代表性的膀胱癌的标志物;MDK,CDC2,IGFBP5和HOXA13组合使用的效果。结果表明,通过组合使用,如果IL8Rb单独与每个标志物(图2,图14和图15至图17)组合使用,而且还有当与四个BTM标志物的所有可能组合一起用作特征时,将TCC患者的样本和那些非恶性疾病患者的样本区分开的能力得到了提高。如图10至图13所示,IL8Rb加入到四个标志物MDK,CDC2,IGFBP5和HOXA13(uRNA-D)中不仅相比单独的四个标志物增加了测试的整体表现,而且与其他已知的测试相比该测试也是非常有利的,其他已知的测试包括:埃利萨的“美国马萨诸塞州Matritech,Inc.的注册商标”,NMP22(美国马萨诸塞州Matritech,Inc.的注册商标),和细胞学。图14至图17也示出了IL8Rb在四个标志物MDK,CDC2,IGFBP5和HOXA13的各种组合中的效果。图14示出了使用五个不同的分类器模型(i)线性判别分析(LDA),(ii)逻辑回归(LogReg),(iii)支持向量机(SVM),(iv)K-5最近邻(KN5N),以及(v)划分树分类器(TREE)计算的四个标志物MDK,CDC2,IGFBP5和HOXA13加上和不加IL8Rb的所有组合的ROC曲线图。图15列表显示了所有5种分类器及4个生物标志物加上和不加IL8Rb的所有15种组合的曲线下面积(AUC)。此AUC计算被限制在假阳性率0至20%的面积,覆盖特异性的有效范围(80-100%)。AUC定量了图14的ROC曲线上的可见差异。图16示出了在具有和不具有IL8Rb时所测量的4个标志物的所有组合在特异性为(a)80%,(b)85%,(c)90%,(d)95%,和(e)98%的敏感性。图17列表显示了在固定特异性分别为(a,f)80%,(b,g)85%,(c,h)90%,(d,i)95%,和(e,j)98%时,灵敏度(ROC曲线上的垂直方向;较好的是“向上”)或特异性(ROC曲线上的水平方向;较好的是向左)的变化。这些结果表明,通常IL8Rb提高了生物标志物(MDK,CDC,IGFBP5和HOXA13),单独地或组合地,从正常的样本中分类出肿瘤的能力。这些结果通常表明IL8Rb能够增加测试能够检测出的膀胱癌或尿路上皮癌的精度。最大的收获是可看到标志物未加入IL8Rb则表现不好,或者分类器表现不好。较小的收获是可看到在加入IL8Rb之前标志物和/或分类器表现很好,因此其改进的空间较小。重要的是注意到,结果显示基于群体的分析以及当诊断个体患者,尤其是那些对BTM标志物的表达的诊断可能不清楚的患者,加入IL8Rb的益处可能更大。这些结果表明,IL8Rb不仅可以用于检测膀胱炎性疾病,在与标志物结合时还可以用于检测膀胱癌,导致减少“假阳性”结果减少引起的改进的膀胱癌检测。这些结果还表明IL8Rb的效用在于,其影响到各种标志物组合的整体表现,并且证实了IL8Rb改善一个或多个膀胱癌标志物精确检测患者中癌症的表现的能力。此外,图14和图15表明,使用一系列分类器模型可以实现相同的结果,以及表明该结果不依赖于分类器模型或算法,而是依赖于所用的标志物的组合。这些结果证实,任何适当的分类器模型或算法可以在本发明中使用。特别是,图14和图15表明,IL8Rb在较高特异性上的效果更大,特别是在临床上最适用的范围内。因此,使用本发明的G+P指数,我们能够基于表型变量和遗传变量准确地归类血尿患者到不同组:“高风险”组,患有尿路上皮癌组并且需要立即进一步的病情检查,“风险”组,并且需要立即的病情检查,“低风险”组,患者可以置于观察名单上,用于以后的评估。在身体样本中检测遗传标志物在若干优选的实施例中,对癌症的测定可期望在从血液,血浆,血清,例如使用腹腔冲洗液获得的腹膜液,或其它体液,例如尿,淋巴液,脑脊髓液,胃液或粪便样本上获得的样本上进行。对于检测膀胱的炎性病症或膀胱癌,理想地是,测试在尿样上进行。具体而言,用于检测炎性膀胱疾病或膀胱癌的本方法可以在来自身体的任何合适的样本上执行,该样本将指示尿液的,但是理想地是IL8RB的,以及任何直接从尿样中确认的其他癌症标志物的水平。检测可以对尿样直接进行,或者样本可以通过加入本领域中已知的任何合适的化合物或缓冲剂被稳定,从而稳定并防止样本中RNA和/或蛋白的分解,使得其可以在稍后进行分析,甚至确保在分析过程中RNA和/或蛋白是稳定的。确定受试者尿液中的蛋白和/或RNA水平可以直接对尿液进行,或者可以对尿液进行处理,以进一步纯化和/或浓缩RNA和/或蛋白质。用于提取和/或浓缩蛋白和/或RNA的许多方法在本领域中是众所周知的,并且可以在本发明中使用。可以理解的是,许多方法是本领域公知的用于确认特定基因的表达水平,RNA和/或蛋白的水平,并且可以在本发明中使用任何合适的方法。一些常用的方法概述如下,然而,本发明并不限于这些方法,并且用于定量蛋白和/或RNA水平的任何方法都是适用于本发明的。使用基因型标志物检测疾病和癌症的一般方法用于确定表达水平的一般方法概述如下,但是可以理解的是,用于确定表达水平的任何方法都是合适的。定量聚合酶链反应(qPCR)定量PCR(qPCR)可以使用特定的引物和探针对肿瘤样本,血清和血浆进行。在受控制的反应中,在PCR反应中形成的产物的量(Sambrook,J.,EFritsch,E.和TManiatis,MolecularCloning:ALaboratoryManual3rd.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(2001))与初始模板的量相关联。PCR产物的定量可以在反应物变得有限之前通过在对数期时停止PCR反应来进行。然后PCR产物在琼脂糖或聚丙烯酰胺凝胶中电泳,用溴化乙锭或类似的DNA染色剂染色,并且染色的强度通过光密度测定法测量。可替代地,PCR反应的进展可以使用PCR机器例如AppliedBiosystems’Prism7000TM(美国,康涅狄格州,AppleraCorporation的商标)或RocheLightCyclerTM(美国,加利福尼亚,RocheMolecularSystems,Inc.的商标)测量,其实时测量产物的积累。实时PCR测量DNA嵌入染料例如SybrGreen进入合成的PCR产物的荧光,或当猝灭剂分子裂解时报告物分子释放的荧光;报告物分子和猝灭剂分子被掺入到寡核苷酸探针中,该寡核苷酸探针杂交到在延伸自引物寡核苷酸的DNA链之后的目标DNA分子。寡核苷酸探针被在下个PCR循环中的Taq聚合酶的酶促作用移位并降解,从猝灭剂分子中释放报告物。在一个变型中,众所周知的Scorpion,该探针共价连接至引物。逆转录PCR(RT-PCR)RT-PCR可以用于比较不同样本群体,正常和肿瘤组织,有或没有药物治疗的RNA水平,以表征表达模式,在密切相关的RNA之间做区分,并且分析RNA结构。对于RT-PCR,第一步是从目标样本中分离RNA。初始材料典型地是分别从人类肿瘤或肿瘤细胞系,和相应的正常组织或细胞系中分离出的所有RNA。RNA可从各种样本中分离,例如来自乳房,肺,结肠(例如,大肠或小肠),结肠直肠,胃,食道,肛门,直肠,前列腺,脑,肝,肾,胰腺,脾脏,胸腺,睾丸,卵巢,子宫,膀胱等组织,原发性肿瘤或肿瘤细胞系的组织,以及来自健康供体的合并样本的肿瘤样本。如果RNA的来源是肿瘤,RNA可以从,例如,冷冻的或存档的石蜡包埋并且固定(例如,福尔马林固定的)的组织样本中提取。通过RT-PCR的基因表达分析的第一步是将RNA模板逆转录成cDNA,接着在PCR反应中其指数扩增。两种最常用的逆转录酶是禽成髓细胞瘤病毒逆转录酶(AMV-RT)和莫洛尼鼠白血病病毒逆转录酶逆转录步骤典型地依赖于不同的情况和表达谱的目的,使用特定的引物,随机六聚体,或寡-dT引物做指引。例如,提取的RNA可以按照制造商的说明使用RNAPCR试剂盒(美国,加利福尼亚,PerkinElmer)进行逆转录。然后获得的cDNA可以在随后的PCR反应中用作模板。尽管PCR步骤可以使用多种热稳定的依赖DNA的DNA聚合酶,但其通常采用TaqDNA聚合酶,其具有5'-3'核酸酶活性但缺乏3'-5'校对核酸内切酶活性。因此,qPCR(美国加利福尼亚州,RocheMolecularSystems,Inc.的注册商标)通常利用Taq或Tth聚合酶的5'核酸酶活性来水解结合到其目标扩增子的杂交探针,但是具有等效的5'核酸酶活性的任何酶都可以使用。两个寡核苷酸引物被用于产生PCR反应的典型特征的扩增子。第三个寡核苷酸或探针,被设计成用于检测位于两个PCR引物之间的核苷酸序列。探针是不可被TagDNA聚合酶延伸的,并用报告物荧光染料和猝灭剂荧光染料示踪。当两种染料在探针上的位置彼此靠近时,来自报告物染料的任何激光诱发的发射由猝灭剂染料淬灭。在扩增反应过程中,TaqDNA聚合酶以依赖模板的方式裂解探针。所得探针片段在溶液中解离,并且来自释放的报告物染料的信号是免于第二荧光团的淬灭效应的。报告物染料的一个分子被释放用于每个合成的新分子,并且非淬灭的报告物染料的检测为数据的定量解释提供基础。RT-PCR(美国,加利福尼亚州,RocheMolecularSystems,Inc.的注册商标)可以使用商售设备实施,例如,ABIPRISM7700TM序列检测系统(美国,康涅狄格,AppleraCorporation的商标)(美国,加利福尼亚州,福斯特城,Perkin-Elmer-AppliedBiosystems),或LightcyclerTM(美国,加利福尼亚州,RocheMolecularSystems,Inc的注册商标)(德国,曼海姆,RocheMolecularBiochemicals)。在优选的实施例中,5'核酸酶程序在实时定量PCR装置如ABIPRISM7700TM序列检测系统上运行。该系统由热循环仪,激光器,电荷耦合器件(CCD),摄像头和计算机组成。该系统以96孔格式放大热循环仪上的样本。在扩增过程中,激光诱导的荧光信号通过所有96孔的光纤电缆实时收集,并且在CCD处检测到。该系统包括运行仪器以及分析数据的软件。5'核酸酶测定数据最初表达为Cp,或循环阈值。如上所讨论的,荧光值在每个循环期间被记录并且代表产品的量扩增到扩增反应中的某一点。当荧光信号第一次被记录为统计显著时,该点就是循环阈值Cp。实时定量PCR(qRT-PCR)RT-PCR技术最近的变化是实时定量PCR,其通过双示踪的荧光生成试剂探针(即探针)测量PCR产物积累。实时PCR与定量竞争PCR和定量比较PCR均兼容,前者为每个目标序列的正常化使用内部竞争者,而后者使用包含在样本内的标准化基因,或RT-PCR的管家基因。进一步的细节由,例如,Held等人,GenomeResearch6:986-994(1996)提供。可以使用固定的石蜡包埋组织作为RNA源来确定表达水平。根据本发明的一个方面,PCR引物被设计为存在于要被扩增的基因中的侧翼内含子序列。在本实施例中,引物/探针设计的第一步是划定基因内的内含子序列。这可以通过公开可用软件来完成,例如由Kent,W.J.,GenomeRes.12(4):656-64(2002)开发的DNABLAT软件,或由BLAST软件及其演变。后续步骤按照完好建立的PCR引物和探针方法进行。为了避免非特异性信号,在设计引物和探针时,掩盖内含子内的重复序列是有用的。这可以通过使用贝勒医学院在线可用的重复掩蔽程序很容易实现,其对重复元素库掩藏DNA序列,并返回在其中重复元素被掩蔽的查询序列。然后可以使用任何商业上或其他公开可用的引物/探针设计包,例如PrimerExpress(AppliedBiosystems);MGBassay-by-design(AppliedBiosystems);Primer3(SteveRozenandHelenJ.Skaletsky(2000)Primer3ontheVIMNVforgeneralusersandforbiologistprogrammersin:KrawetzS,MisenerS(eds)BioinformaticsMethodsandProtocols:MethodsinMolecularBiology.HumanaPress,Totowa,NJ,pp365-386),掩蔽序列可用于设计引物和探针序列。PCR引物设计中需考虑的最重要因素包括引物长度,熔化温度(Tm),和G/C含量,特异性,互补引物序列,和3'末端序列。一般情况下,最佳的PCR引物通常是长度为1730的碱基,并含有约20-80%,例如,约50-60%G+C碱基。熔化温度在50至80℃之间,例如,约50至70℃通常是优选的。有关PCR引物和探针设计的进一步的指导方针请见,例如,Dieffenbach,C.W.等人,GeneralConceptsforPCRPrimerDesignin:PCRPrimer,ALaboratoryManual,ColdSpringHarborLaboratoryPress,NewYork,1995,pp.133-155;InnisandGelfand,OptimizationofPCRsin:PCRProtocols,AGuidetoMethodsandApplications,CRCPress,London,1994,pp.5-11;以及Plasterer,T.N.Primerselect:Primerandprobedesign.MethodsMol.Biol.70:520-527(1997),其整个公开都明确通过引用并入在本说明书中。微阵列分析差异表达也可以使用微阵列技术来识别,或者证实。因此,疾病特异性标志物的表达谱可以使用微阵列技术在新鲜或石蜡包埋的肿瘤组织中测定。在该方法中,所关注的多核苷酸序列(包括cDNA及寡核苷酸)在微芯片底物上铺排,或排列。然后排列的序列(即捕获探针)与来自所关注的(即,目标)细胞或组织的特定多核苷酸杂交。正如RT-PCR法,RNA的来源通常是分离自人类肿瘤或肿瘤细胞系的全部RNA,以及相应的正常组织或细胞系。因此RNA可以从多种原发性肿瘤或肿瘤细胞系中分离。如果RNA的来源是原发性肿瘤,那么RNA可以,例如,从冷冻或存档的福尔马林固定的石蜡包埋(FFPE)组织样本和固定的(如福尔马林固定的)组织样本中提取,在日常临床实践中,这些样本是常规制备和保存的。在微阵列技术的具体实施例中,cDNA克隆的PCR扩增嵌入物施加到底物上。底物可以包括最多1,2,5,10,15,20,25,30,35,40,45,50,或75个核苷酸序列。在其它方面,底物可以包括至少10,000个核苷酸序列。固定在微芯片上的微阵列序列,适合于在严格条件下的杂交。如其它实施例,微阵列的目标可以是至少长度为50,100,200,400,500,1000,或2000个碱基;或长度为50-100,100-200,100-500,100-1000,100-2000或500-5000个碱基。如其他实施例,微阵列的捕获探针可以是至少长度为10,15,20,25,50,75,80,或100个碱基;或长度为10-15,10-20,10-25,10-50,10-75,10-80,或20-80个碱基。荧光标记的cDNA探针可通过从所关注的组织中提取的RNA的逆转录掺入荧光核苷酸产生。施加到芯片的标记的cDNA探针具有特异性地杂交到阵列上的DNA的各点。经过严格洗涤以除去非特异性结合的探针后,该芯片通过激光共聚焦显微镜或另一种检测方法,例如CCD照相机,扫描。每个阵列单元的杂交定量允许评估相应的mRNA丰度。用双色荧光,由两个RNA来源产生的分别标记的cDNA探针成对杂交到阵列。因此对应于每个指定基因的两种来源的转录物的相对丰度被同时确定。杂交的小型化规模为大量基因提供对表达模式方便和快速的评价。此类方法已经显示出具有检测稀有转录所需的灵敏度,其在每个细胞中的几个拷贝上被表达,并且可再现地检测在表达水平上至少约两倍的差异(Schena等人,Proc.Natl.Acad.Sci.USA93(2):106-149(1996))。微阵列分析可按照生产商的协议,通过商售设备来进行,例如使用Affymetrix技术,Illumina微阵列技术或Incyte的微阵列技术。用于基因表达的大规模分析的微阵列方法的发展使得有可能系统地搜索多种肿瘤类型的癌症分类的分子标志物和结果预测。RNA分离,纯化和扩增mRNA提取的一般方法在本领域中是众所周知的,并且在分子生物学的标准教科书,包括Ausubel等人,CurrentProtocolsofMolecularBiology,JohnWileyandSons(1997)中公开。从石蜡包埋组织中提取RNA的方法公开在,例如,RuppandLocker,LabInvest.56:A67(1987),和DeSandres等人,BioTechniques18:42044(1995)。特别地,可以使用来自商家,例如Qiagen的纯化试剂盒,缓冲液组和蛋白酶,根据制造商的说明进行RNA分离。例如,来自体外培养的细胞的全部RNA可以用Qiagen“德国,希尔登,QiagenGmbH的注册商标”微型列被分离出来。其他商售的RNA分离试剂盒包括MasterPureTMCompleteDNAandRNAPurificationKit(EPICENTRE(D,Madison,WI),和ParaffinBlockRNAIsolationKit(Ambion,Inc.)。来自组织样本的全部RNA可以使用RNAStat-60(Tel-Test)进行分离。制备自肿瘤的RNA可,例如,通过氯化铯密度梯度离心被分离。使用固定的、石蜡包埋的组织作为RNA来源,包括mRNA分离,纯化,引物延伸和扩增用于分析基因表达的有代表性的协议的步骤在各种出版的期刊文章中给出(例如:T.E.Godfrey等人J.Molec.Diagnostics2:84-91(2000);K.Specht等人,Am.J.Pathol.158:419-29(2001))。简要地说,有代表性的过程开始于切割约10微米厚的石蜡包埋的肿瘤组织样本的切片。然后提取RNA,以及去除蛋白和DNA。在分析RNA浓度后,如果需要的话,可以包括RNA修复和/或扩增步骤,并且使用RT-PCR跟随的基因特异性启动子逆转录RNA。最后,分析数据,以在检查肿瘤样本中鉴别的特征基因表达模式的基础上确定对患者最佳的治疗选择。免疫组织化学技术和蛋白质组学免疫组织化学方法也适用于检测本发明的增殖标志物的表达水平。因此,抗体或抗血清,优选多克隆抗血清,及最优选的特定于每个标志物的单克隆抗体,用于检测表达。抗体可通过直接标记抗体本身被检测,例如,用放射性标记,荧光标记,半抗原标记例如生物素,或酶例如辣根过氧化物酶或碱性磷酸酶。可替代地,未标记的初级抗体与经标记的二次抗体(包括抗血清,多克隆抗血清或特异于初级抗体的单克隆抗体)结合使用。免疫组织化学协议和试剂盒在本领域中是众所周知的,并且是商售的。蛋白质组学可用于在某一时间点对存在于样本(例如,组织,有机体,或细胞培养物)中的多肽进行分析。特别是,蛋白质组技术可用于评估样本中多肽表达的全局变化(也称为表达蛋白质组学)。蛋白质组学分析典型地包括:(1)通过2-D聚丙烯酰胺凝胶电泳(2-DPAGE)分离样本中的单个多肽;(2)鉴定,例如,通过质谱法或N-末端测序法从凝胶中回收的单个多肽,和(3)使用生物信息学分析数据。蛋白质组学方法对于补充基因表达谱的其他方法是有价值的,并且可以单独地或与其他方法组合地用于检测本发明的增殖标志物的产物。使用为标志物选择的核酸探针的杂交方法这些方法涉及将核酸探针结合于载体,并且在合适的条件下与从测试样本获得的RNA或cDNA杂交(Sambrook,J.,EFritsch,E.andTManiatis,MolecularCloning:ALaboratoryManual3rdColdSpringHarborLaboratoryPress:ColdSpringHarbor(2001))。这些方法可以应用于来源于肿瘤组织或流体样本的标志物。所述RNA或cDNA标本通常用荧光或放射性分子标记,以使能检测和定量。在一些应用中,杂交的DNA可以用支链,荧光标记的结构进行标记,以提高信号强度(Nolte,F.S.,BranchedDNAsignalamplificationfordirectquantizationofnucleicacidsequencesinclinicalspecimens.Adv.Clin.Chem.33,201-35(1998))。在通过荧光检测或凝胶图像的光密度法定量杂交的量之前,未杂交的标记通过在低盐溶液如0.1xSSC,0.5%SDS中全面洗涤去除。该载体可以是固体,如尼龙或硝酸纤维素膜,或由在悬浮液体中时杂交的微球体或珠组成。为允许洗涤和纯化,珠子可以是磁性的(Haukanes,B-1andKvam,C.,Applicationofmagneticbeadsinbioassays.Bio/Technology11,60-63(1993))或荧光标记的,以能够使用流式细胞仪(例如参见:Spiro,A.,Lowe,M.andBrown,D.,ABead-BasedMethodforMultiplexedIdentificationandQuantitationofDNASequencesUsingFlowCytometry.Appl.Env.Micro.66,4258-4265(2000))。杂交技术的一个变种是QuantiGene测定(美国,加利福尼亚州,Panomics的注册商标)(Genospectra,Fremont),其结合了荧光珠载体和分支DNA信号扩增。杂交技术的另一个变种是mRNA测定(明尼阿波利斯,R&DSystem)。方法如制造商的使用说明中所描述的。简要地说,测定使用结合到地高辛的寡核苷酸杂交探针。在颜色测定法中,用连接到碱性磷酸酶的抗地高辛抗体检测杂交。其他方法在本领域是公知的,不需要在本说明书中进一步说明。酶联免疫吸附测定(ELISA)简言之,在夹心ELISA测定法中,针对标志物的多克隆或单克隆抗体结合到固体载体(Crowther,J.R.TheELISAguidebook.HumanaPress:NewJersey(2000);Harlow,E.andLane,D.,Usingantibodies:alaboratorymanual.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(1999))或悬浮液珠上。其他方法是本领域已知的,不需要在本说明书中进一步说明。单克隆抗体可以是衍生于或选自噬菌体抗体库的杂交瘤(HustM.andDubelS.,Phagedisplayvectorsfortheinvitrogenerationofhumanantibodyfragments.MethodsMolBiol.295:71-96(2005))。非特异性结合位点被非目标蛋白制剂和洗涤剂阻挡。然后,捕获抗体用来自带有抗原的患者的样本或组织的制剂培养。在抗体/抗原复合物用检测目标标志物的第二抗体培养之前,洗涤该混合物。所述第二抗体通常结合到荧光分子或其他报告物分子上,其可以在酶反应中被检测到或用结合到报告物的第三抗体检测到(Crowther,同上)。或者,在直接ELISA测定中,含有标志物的制剂可以结合到载体或珠,并直接用抗体—报告物结合物检测目标抗原(Crowther,同上)。用于制备单克隆抗体和多克隆抗血清的方法是本领域中是众所周知的,不需要在本说明书中进一步说明。免疫检测该方法也可以用于来自切除肿瘤术前和术后的膀胱癌患者的血清或血浆中标志物家族成员的免疫检测,其它癌症患者的标志物家族成员的免疫检测,包括但不限于,结肠直肠癌,胰癌,卵巢癌,黑色素瘤,肝癌,食道癌,胃癌,子宫内膜癌,和脑癌,以及来自膀胱癌患者的尿液和粪便中的标志物家族成员的免疫检测。也可使用其他标准免疫检测技术,例如免疫印迹法或免疫沉淀法(Harlow,E.andLane,D.,Usingantibodies:alaboratorymanual.ColdSpringHarborLaboratoryPress:ColdSpringHarbor(1999))检测组织或样本中的疾病标志物。在免疫印迹法中,来自组织或含有标志物的液体的蛋白制剂,在变性或非变性条件下,通过聚丙烯酰胺凝胶被电泳。然后蛋白被转移到膜载体例如尼龙。如在免疫组织化学技术中所说明的,然后该标志物直接或间接地与单克隆或多克隆抗体反应。或者,在一些制剂中,蛋白可以直接点样到膜上,而不用事先电泳分离。信号可以用光密度法进行定量。在免疫沉淀法中,含有标志物的可溶性制剂在针对标志物的单克隆或多克隆抗体中培养。然后该反应用由带有共价连接的蛋白A或蛋白G的琼脂糖或聚丙烯酰胺制成的惰性珠来培养。蛋白A或蛋白G珠特别地与形成结合到珠的抗体—标志物—抗原的固定复合物的抗体相互作用。洗涤后,结合的标志物可以通过免疫印迹法或ELISA检测和定量。基于基因型分析建立诊断一旦已经获得IL8Rb和可选的一个或多个进一步的癌症标志物的表达水平,那么该受试者的诊断可以被建立。如果IL8Rb的表达是在没患有炎性膀胱疾病的受试者中可见的表达之上,和/或与已知患有炎性膀胱疾病的受试者的表达水平相一致,那么受试者将被诊断为患有炎性膀胱疾病。或者,如果IL8Rb的表达不是在没患有炎性膀胱疾病的受试者中可见的表达之上,和/或在已知患有炎性膀胱疾病的受试者的表达水平之下,那么受试者将被诊断为没患有炎性膀胱疾病。在IL8Rb与膀胱癌的一个或多个标志物结合使用的情况下,则IL8Rb的表达水平将与没患有炎性膀胱疾病的受试者,和/或已知患有炎性膀胱疾病的受试者的表达水平进行比较。该一个或多个癌症标志物与没患有膀胱癌的受试者和/或已知患有膀胱癌的受试者的表达水平进行比较。如果IL8Rb的表达水平与没患有炎性膀胱疾病的受试者一致(小于患有炎性膀胱疾病的受试者)并且一个或多个膀胱癌标志物的表达水平与患有膀胱癌的受试者一致(差别于没患有膀胱癌的受试者),那么受试者被诊断为患有膀胱癌。如果IL8Rb的表达水平比没患有炎性膀胱疾病的受试者高(与患有炎性膀胱疾病的受试者一致)并且所述一个或多个膀胱癌标志物的表达水平与患有膀胱癌的受试者一致(差别于没患有膀胱癌的受试者),那么受试者被诊断为具有炎性膀胱疾病。如果IL8Rb的表达水平与没患有炎性膀胱疾病的受试者一致(小于患有炎性膀胱疾病的受试者)并且所述一个或多个膀胱癌标志物的表达水平与没患有膀胱癌的受试者一致(差别于确实患有膀胱癌的受试者),那么受试者被诊断为既没患有膀胱癌也没患有炎性膀胱疾病。因为诊断用标志物的正常和疾病的表达之间经常有表达水平的重叠,为给受试者建立诊断,典型的是建立分类阈值。分类阈值是一个值或阈值,其区分受试者到疾病类别或非疾病类别中。通常使用接受者操作特性(ROC)曲线来评估阈值,其绘制对于所有可能的阈值的灵敏度对特异性。诊断阈值的确定对于使用疾病标志物的测试,可以得出诊断阈值,其使能样本被称为该疾病的阳性或阴性,例如,膀胱癌。这些诊断阈值通过分析进行了膀胱癌或炎性膀胱疾病的存在的调查的一批患者来确定。诊断阈值可以针对不同的测试应用而变化;例如,对于在群体筛查中使用测试的诊断阈值使用基本上没有泌尿症状的一批患者确定,并且这些诊断阈值可以不同于那些用在测试处于膀胱癌复发监视中的患者的阈值。诊断阈值可以被选择以提供在所需的临床环境中的实践水平的测试特异性;即,允许合理的灵敏度而没有数目过多的接收假阳性结果的患者的特异性。这种特异性可以是在80-100%的范围内。诊断阈值通过将每个标志物的基因型表达水平结合的算法应用到来自前瞻性临床试验的每个样本上来确定。使用的样本来自膀胱癌患者和一系列非恶性泌尿紊乱患者。诊断阈值通过确定导致所期望特异性的算法的得分来选择。例如,在一些应用中,85%的特异性是所期望的。然后诊断阈值通过选择导致85%的没有膀胱癌的患者被正确归类为癌症阴性的算法得分来设置。在其他应用中(例如群体筛查),倾向于更高的特异性,例如90%。为给此应用设置阈值,导致90%的没有膀胱癌的患者被正确归类为癌症阴性的算法得分被选择。使用算法的示例在示例中概述。作为单一阈值的替代,测试可以使用测试间隔,其提供不同程度的疾病存在的可能性,并且具有与它们相关联的不同的临床结果。例如,测试可能有三个间隔;一个与膀胱癌存在的高风险(例如90%)相关联,第二个与膀胱癌的低风险相关联,第三个视为疾病疑似。“疑似”间隔可以与建议在所界定的时间周期内做重复测试相关联。数据分析一旦完成测试RNA和/或蛋白的量的方法,则为了确定与肿瘤和非肿瘤样本相关联的生物标志物值的分布,必须分析数据。这通常包含正规化原始数据,即,去除背景“噪音”等并计算任何双重(或以上)数据的平均值,与标准比较,并且建立界点值或阈值以最佳分离两类样本。已知许多方法能做到这一点,并且确切方法将取决于所使用的确定RNA和/或蛋白的量的具体方法。下面是当使用qRT-PCR时,数据分析如何被实施的示例。然而,可以理解的是,一般过程可适应于用于建立RNA和/或蛋白含量的其它方法,或者其它方法可以通过本领域的技术人员来建立以实现相同的结果。数据荧光测量在PCR的每个循环的波长ωii=1,2上进行。因此,对于每个孔,我们观察到一对荧光曲线,由ft(ωi)表示,其中t=1,…,k表示循环数,并且i=1,2索引波长。荧光曲线有一个S形的形状,其开始于邻近的水平基线并且平滑地增加至上渐近线。荧光曲线与直线基线分开的点Cp的位置将被用于表征目标基因的浓度。Cp的准确定义如下。下面是处理这些数据的方案的示例。·补偿频段之间的荧光重叠,·为每个荧光曲线评估平滑模型以估算Cp·组合来自复制的孔的数据。·估算标准曲线·计算相对于标准的浓度。每个生物样本产生5个基因的相对浓度,它们是判别函数的输入数据。色彩补偿用Wtj(ω)表示在循环t与频率ω的染料j的荧光水平。在复用测定中,在任何频率ω的测量响应是在该频率的所有染料的贡献的总和,对于每个循环均是如此。ft(ω)=Wt1(ω)+Wt2(ω)+…色彩补偿的目的是从所观察到的混合物ft(ω)中提取个体贡献Wtj(ω)。在理想的情况下,由于在频率ω的染料j的荧光Wtj(ω0)与其在参考频率ω0的荧光Wtj(ω0)成比例,而不管Wtj(ω0)的水平。这表明对于某些待确定的比例常数A12和A21是线性关系。实际上有通过引入线性项到该系统中有效地建模的额外效果,所以尽管被线性基线扭曲,在估计“色彩补偿”参数A12和A21后,我们可以通过矩阵乘法恢复Wt1(ω1)和Wt2(ω2):Wt1(ω1)和Wt2(ω2)被称为“颜色补偿”数据。当评估低于2的色彩补偿数据的模型时,此表达式的最后一项的线性失真将被容纳在基准估算内。它对于Cp估算没有影响。色彩补偿系数的估算需要使用单一(与双重相对)探针的单独测定。则Wt2(ω2)=0,得出:因此,ft(ω2)=A21ft(ω1)+a*+b*t系数A21可以通过ft(ω2)关于ft(ω1)和PCR循环t,其中t=1,…,k的普通线性回归来估算。模型估计在这一部分中,让ytt=1,…,k表示色彩补偿的荧光曲线。扩增模型只是为荧光曲线而估计的,该荧光曲线显示不平凡的扩增。我们定义术语“扩增”为从色彩补偿的荧光曲线的线性基线的非平凡偏差。使用信噪比(SNR)来定量扩增。这里的SNR被定义为信号方差与噪声方差的比值。噪声方差设定为测定程序校准的一部分,并且保持不变:为此目的,使用来自对于没有扩增的孔,即没有RNA的孔的基线的线性模型的剩余方差,。对于每一个荧光曲线,估计信号方差作为来自最佳拟合直线的剩余方差(“最佳”是指在最小平方意义上)。·如果SNR低于指定的阈值,则荧光曲线接近线性和无扩增存在。然后没有从基线离开的点并且样本中的浓度可被定为零。·如果SNR高于阈值,则扩增存在并且浓度可以估算。选择(无量纲)SNR的阈值以提供“扩增”和“非扩增”曲线之间的明确区别。例如,阈值的以下范围是对标志物是有效的。模型为每个荧光曲线估计S形模型。模型的任何合适的参数形式都可以使用,但必须能够将以下特征模型化:·可以具有非零斜率的线性基线,·关于中点不对称。·在下部和上部水平的渐近线·从基线到上渐近线的平滑增加实现这些要求的模型的一个示例是我们称此为“6PL模型”。参数向量θ=[A,As,D,B,E,F]是受以下限制的,以确保gt(θ)为t的递增函数并且具有荧光曲线的实证性质。D>0,B>0,E<0,F<0其他两个参数确定基准线A+ASt,并且这些参数并不需要明确的约束,但是A始终为正并且坡度参数AS总是很小。参数D确定基线以上的扩增水平。剩余的参数B、E、F本身没有固有的解释而是控制曲线的形状。这些参数也是仅有的影响Cp的估算的参数。当AS=0,这是众所周知的5参数逻辑函数(5PL),如果,另外,F=1,这个模型降低为4参数逻辑模型(4PL),GottschalkandDunn(2005),Spiess等人(2008)。初始化对于非线性估计初始值设定为·AS=0,F=1·A=mean(y,…,y5)·D=range(y1,…,yk)·B=对应于半高的循环·E通过转换gt(θ)为线性形式进行初始化,该线性形式已设置其余参数的值为上述定义的它们的初始值。线性化获得现在,对于所选择的t,通过对回归估算E,使得导致(与其自身的初始化)几乎相同的分析的该模型的另一种形式是:当AS=0时,有时这被称为Richards方程,Richards(1959)。估算准则估算参数,以最小化惩罚平方和的准则:这里λ(θ)是惩罚θ中一些(或所有)参数的大值的非负函数。此方法被称为正则化回归或岭回归(Hoerl,1962),并且可以通过设置参数向量θ的合适的先验分布从贝叶斯观点导出。惩罚的满意选择是:λ(θ)=λ(B2+D2+E2+F2)大值的λ使参数估计值倾向于零,并降低了参数估计值的变化。相反,小的(或零)λ导致不稳定的参数估计值和最小化算法收敛困难。λ的选择是偏差和方差或稳定性之间的折衷。经验证据表明,如果λ在以下范围内选择,可以实现偏差和方差之间满意的折衷:0.01>λ>0.0001这个选择也保证了优化算法的收敛性。算法的选择对于λ在上述范围内的任何选择,在前面的段落中的描述完全定义了参数估计。基于传统的高斯-牛顿法(如在More中实现的Levenberg-Marquardt算法,1978)的非线性最小平方法已成功地被使用并且是合适的方法。优化算法的一般目的,例如NelderandMead,1965,或Byrd等实现的Broyden-Fletcher算法,1995)也已成功地在本说明书中被试验。Cp估计Cp是在时间t的点,其最大化了gt(θ)的二阶导数。每个荧光曲线产生一个Cp,其表征目标基因的浓度。每组技术复制的所估计的Cp的平均值被计算并在随后的分析中使用。标准曲线绝对浓度或相对浓度从与同一PCR板的标准曲线进行比较而得出。使用线性模型对稀释系列建模:Cp=R+Slog10Conc其中,Conc是该标准的绝对浓度或相对浓度。截距和斜率参数是针对具体板的。通过设置群体模型对截距和斜率参数中板之间的变异建模:其中,参数μR,μS,如下所述在现有数据的基础上设置。然后给定的板R和S可以被解释为来自这些群体的观察。对于在浓度Concj的标准的仿样i,以下模型可使用:Cp(i,j)=R+Slog10Concj+∈ij其中,需要注意的是残差的方差取决于Cp。Var(εij)的经验估计见表2。通过最大化似然函数估计参数R和S。通过以下表达式根据PCR过程的效率解释斜率参数:此模型有贝叶斯解释:给定参数μR,μS,模糊(无信息)的先验分布。然后R和S和Cp(i,j)的群体模型完全确定了现有数据的概率模型。马尔科夫链蒙特卡罗(MCMC)算法(Lunn等人,2009)允许对μR,μS,的估算。如果省略了先验分布,会得到传统的频率论解释结果。依照此估计程序,能够获得表3中的依赖基因的群体参数估计。表2:残差方差Cpσ2Cpσ2120.0100210.0466130.0108220.0625140.0119230.0860150.0134240.1212160.0155250.1750170.0184260.2591180.0224270.3931190.0279280.6112200.0356290.9741表3:标准曲线的斜率和截距的总体参数标准曲线的截距和斜率的估计由和表示。相对浓度ΔCp使用标准曲线由表达式来计算浓度ConcREF下的Cp(REF)。样本的相对浓度由以下表达式给出:或者,可在对应于PCR效率为2的固定水平来近似。则为任何一种选择使用相同的符号ΔCp。所得的ΔCp估计,每个基因一个,作为下一步中的判别函数的输入值。判别函数所述ΔCp值对应于去除板到板变化的相对生物标志物值。5个ΔCp值的彼此对照检查(例如,参见图2),显示了肿瘤样本通常是如何与肺肿瘤样本具有不同的生物标志物值的。此外,虽然肿瘤和正常组织有区域重叠,但是大量样本被有效分离。在这些情况下,许多不同的统计分类器可用于从肿瘤样本中分离出正常样本来。我们在这里展示了几个分类器的示范运行以分离这些样本。我们使用5种不同的分类方法:1)线性判别分析(LDA),2)逻辑回归(LogReg);3)支持向量机(SVM);4)基于5个近邻的K最近邻(KN5N);5)递归划分树(TREE)(引用:Venables&RipleyandDalgaard)。分类器的创建需要包含大量样本的生物标志物值的数据集,该数据集应代表由分类器测试的最终群体。例如,如果分类器是用于筛选高危人群的(如50岁和更老,吸烟者),则创建分类器所需的数据集(被称为“训练集”)应反映该群体并仅包含来自大于50岁的吸烟者的样本。通常,为得到像灵敏度和特异性这样的参数的误差小于10%的测量精度,训练集需要大于300个样本。分类器的有效性的估计可使用交叉验证进行。在交叉验证中(维基百科:交叉验证),数据集被划分成小数目的相等大小的分区(通常为3至10个)。一部分留出来,剩下的部分用来建立分类器;然后留出的部分由新的分类器测试并记录下它的预测。对每一个部分都依次这样做,并且所有的预测组合并进行分析,以计算出分类器的特征:灵敏度,特异性,等等。如果交叉验证是通过将数据划分成10份进行的,它被称为10倍交叉验证;同样地,3份将是3倍交叉验证。如果有多少样本数据就被分成多少份,那么这就是所谓的“留一交叉验证”。通过测试不用于构建分类器的数据,此方法提供了在不存在附加样本的情况下,对分类器性能的估计。我们已经使用4个生物标志物,MDK,IGFBP5,CDC2,和HOXA13,加上和不加生物标志物IL8Rb的所有15种组合,利用本说明书中其他部分描述的临床试验数据集(示例1)建立了分类器,并且用10倍交叉验证测试了这30个分类器。这针对上面列出的5个分类器类型的每一个完成并计算出ROC曲线。所有工作使用R统计编程环境(CITE)进行改善。这些结果(图14)表明,在大多数情况下,加上IL8Rb的分类器对诊断有用的特异性的值(假阳性率为0至20%;特异性为100至80%)更为敏感。诊断有用的特异性区域的曲线下面积(AUC)用于定量分类器如何与大的值良好运行的,其表示更好的分类器性能。图15a列表示出了每个分类器和生物标志物组合的AUC,而图15b示出了当加入IL8Rb时,每种条件下AUC的增加量。在大多数情况下,加入IL8Rb提高了做出准确诊断的能力。在图16中用表格列出了所有分类器的对诊断有用的特异性值的具体的灵敏度值。此外,图17以表格列出了加入IL8Rb后,灵敏度或特异性的增益量。分类器的效用被创建,当创建完分类器并对其测试完,它用来测试新的样本。为简化结果的解释,建立临界分数或阈值;在临界分数一侧的样本被认为是肿瘤阳性,而在另一侧的为肿瘤阴性。附加的临界分数可以建立,例如,以指示结果的确定性水平不断提高。在这种情况下,我们已经建立了临界分数,其在我们的训练集中给出了15%的假阳性率。使用我们的交叉验证过的ROC曲线,则我们可以估计我们的敏感性。通常情况下,发明人还在75%的阳性预测值处建立临界分数。为使用这些临界分数,我们为小于由85%的特异性建立的临界分数的分数建立了“阴性”结果。得分高于75%PPV的被称为“阳性”,得分在两者之间的被称为“不确定”或“疑似”。IL8Rb的抗体在另外的方面,本发明包括针对IL8Rb的抗体制造。标志物IL8Rb可以被足量制备以适合于引发免疫反应。在一些情况下,全长IL8Rb可以使用,而在其他情况下,IL8Rb的肽片段可以是足够作为免疫原的。免疫原可以注入合适的宿主(例如,小鼠,兔等),如果想要的话,免疫佐剂,如弗氏完全佐剂或弗氏不完全佐剂可以注射,以增加免疫反应。可以理解的是,制备抗体在免疫学领域中是常规的并且不需要在本说明书中进一步描述。其结果是,可以产生针对IL8Rb的抗体,包括单克隆抗体或噬菌体抗体。仍然在进一步的实施例中,抗体可以针对该蛋白或本说明书中确认的肿瘤标志物的蛋白核或IL8Rb独特的寡核苷酸序列制造。虽然某些蛋白可以被糖基化,但是糖基化模式的变化可以,在某些情况下,导致误检测缺乏寻常糖基化模式的IL8Rb的形式。因此,在本发明的某些方面,IL8Rb免疫原可以包括去糖基化IL8Rb或去糖基化IL8Rb片段。可以使用本领域中已知的一种或多种糖苷酶来实现去糖基化。可替代地,IL8RbcDNA可在糖基化缺陷型细胞系,例如原核细胞系,包括大肠杆菌等中表达。可制成在其中具有IL8Rb编码的寡核苷酸的表达载体。许多这样的载体可基于本领域中已知的标准载体。载体可用于转染各种细胞系,以产生IL8Rb-产生的细胞系,其可以被用于生产期望量的IL8Rb以发展特定抗体或其它检测IL8Rb的其他试剂或用于标准化已有的IL8Rb测定法的其他试剂。试剂盒基于本发明的发现,几种类型的检测试剂盒可以设想和制备。首先,可以制成具有预加载有检测分子(或“捕获试剂”)的检测装置的试剂盒。在检测IL8RbmRNA的实施例中,这种设备包括底物(例如,玻璃,硅,石英,金属等),在其上与待检测的mRNA杂交的作为捕获试剂的寡核苷酸被绑定。在一些实施例中,mRNA的直接检测可以通过将mRNA(用cy3,cy5,放射性或其它标记来标记)杂交到底物上的寡核苷酸来实现。在其他实施例中,mRNA的检测可以通过首先制备与所需的mRNA互补的DNA(cDNA)来完成。然后,标记的cDNA可以杂交到底物上的寡核苷酸,并被检测。抗体也可以在试剂盒中作为捕获试剂使用。在一些实施例中,底物(例如,多孔板)可以具有附接到其上的特定IL8Rb和BTM捕获试剂。在一些实施例中,试剂盒可包括封闭试剂。封闭试剂可用于减少非特异性结合。例如,非特异性的寡核苷酸的结合可使用来自不包含IL8Rb和BTM寡核苷酸的任何方便来源的过量的DNA被减少,例如鲑鱼精子DNA。非特异性抗体结合可以使用过量的阻断蛋白,例如血清白蛋白来降低。可以理解的是,用于检测寡核苷酸和蛋白的许多方法在本领域中是已知的,并且可使用可特定检测标志物相关联分子的任何策略并且其被认为落入本发明的范围内。当结合到固体载体上时,例如抗体芯片,其允许采用单个芯片检测多个标志物,也可以使用抗体。除了底物,测试试剂盒可以包含捕获试剂(如探针),洗涤溶液(例如,SSC,其它盐,缓冲剂,去污剂等),以及检测基团(例如,cy3,cy5,放射性标记等)。试剂盒还可以包括使用说明和包装。可以使用任何合适的技术来实施检测样本中的IL8Rb和BTM,并且可以包括,但不限于,寡核苷酸探针,qPCR或针对癌症标志物产生的抗体。应该理解的是,待测试的样本并不限于疑似为炎性疾病或肿瘤的组织样本。该标志物可被分泌到血清或其他体液中。因此,样本可以包括任何身体的样本,并且包括活检,血液,血清,腹腔冲洗液,脑脊髓液,尿液和粪便的样本。还应当理解,本发明不限于检测人类的癌症,还适用于检测任何动物的癌症,包括但不限于狗,猫,马,牛,羊,鹿,猪和已知患有癌症的任何其他动物。体液中炎性疾病或肿瘤标志物的常规测试一般而言,在这些体液中测定寡核苷酸,蛋白和肽的方法在本领域中是公知的。寡核苷酸的检测可以使用杂交的方法来进行,例如Northern印迹,Southern印迹或微阵列法,或qPCR。用于检测蛋白的方法包括如酶联免疫吸附测定(ELISA),具有抗体的蛋白芯片,悬浮珠粒放射免疫分析法(RIA),免疫印迹和凝集素结合。然而,为了说明的目的,疾病标志物的液体水平可以使用夹心型酶联免疫吸附测定(ELISA)定量。对于血浆测定法,适当稀释的样本的或连续稀释的标准标志物的5微升等分试样和75微升过氧化物酶抗人标志物抗体添加至微量滴定板的孔中。在30℃下30分钟培养时段后,这些孔用0.05%吐温20的磷酸盐缓冲盐水(PBS)冲洗,以除去未结合的抗体。然后标志物和抗标志物抗体的结合复合物在30℃下用含有H2O2的邻苯二胺培养15分钟。该反应通过加入1M硫酸终止,并且用微量滴定板读数器测量492nm处的吸光率。可以理解的是,抗IL8Rb抗体可以是单克隆抗体或多克隆抗血清。也可以理解的是,任何其他体液可以适当地进行研究。在生理意义上,被分泌的标志物不必要是有用的。相反,标志物蛋白或基因进入血清的任何机制,对生产所述可检测,可量化水平的标志物都是有效的。因此,细胞中的可溶性蛋白的正常分泌物,从质膜脱落的膜蛋白,以其形式表达的分泌的可变剪接形式的mRNA或蛋白,细胞死亡(或凋亡)可以产生足够水平的有用标志物。对于使用血清标志物作为工具来诊断和/或评估各种类型癌症的治疗功效的支持越来越多。示例本说明书中描述的示例是为了说明本发明实施例的目的。分析的其他实施例,方法和类型都在分子诊断领域的普通技术人员的范围之内,并不需要在此详细描述。本领域范围内的其他实施例被认为是本发明的一部分。示例1:膀胱癌的基因型分析方法患者:2008年4月至2009年9月期间,485例具有肉眼可见血尿,但没有尿路恶性肿瘤史的患者,在新西兰和澳大利亚的11个泌尿科诊所被招募。紧邻接受膀胱镜检查和任何附加的诊断程序前,每个患者提供一份尿样。进入研究三个月后,做出了诊断。这些485例患者中,使用下述方法成功地获得442例患者的所有五个研究基因的基因表达数据。这些患者的特征示于表4。表4:研究人群I的特点表4示出在患者初次出现显见血尿后的三个月时,每个主要诊断类别中患者的数量。尿液分析:尿样用中央审查细胞学检查(新西兰,达尼丁,SouthernCommunityLaboratories)进行分析。诊断测试NMP22(Matritech)和NMP22ELISA(Matritech)按照制造商的说明在临床现场或由SouthernCommunityLaboratories(NMP22ELISA)实行。RNA定量:每个患者的2mls或尿液用含5.64M异硫氰酸胍,0.5%十二烷基肌氨酸钠和50mMpH6.5醋酸钠的RNA提取缓冲液混合。然后,如前所述,所有RNA由Trizol萃取(Invitrogen)和RNeasy程序(Qiagen)提取。RNA从35ul水的柱中洗脱,并在每个后续单工或双工定量逆转录聚合酶链式反应(qRT-PCR)测定中使用3ul。每16ulqRT-PCR反应含有0.3URNAse-OUT(Invitrogen),0.225uM每个Taqman探针,1.25USuperscriptIII(Invitrogen),0.275uM每种引物,1.5UFastStartTaq聚合酶(Roche),10mMDTT,0.375mMdNTP,4.5mM硫酸镁,1.6ul10xFastStartPCR缓冲液(Roche)和2.6ulGCRich溶液(Roche)。针对五个研究基因MDK,CDC2,HOXA13,1GFBP5和IL8Rb中的每一个的引物和荧光双重标记的探针是从IntegratedDNATechnologies(美国,Coralville)获得的。引物/探针序列示于表2。反应设置在96孔板上并且在RocheLight480上做如下循环:50℃,15分钟;95℃,8分钟;95℃,15秒的10个循环,60℃,2分钟和95℃,15秒的30个循环,60℃,1分钟。参照RNA(从汇集的细胞系衍生的RNA)的1/16系列稀释的标准曲线包括在每块板上以产生0.3pg/μl至20ng/μl的范围。在最后30个热循环的扩展相位上收集数据并作为原始文本文件输出。下面的表5示出了用于五个RNA标志物的qRT-PCR定量的引物和探针序列。表5qRT-PCR数据分析原始荧光数据从Roche480导出为制表符分隔文件,其包含循环次数对板上所有孔的荧光数据的两个通道。该数据用施加色彩补偿([Bernard1999])到数据以校正从一个荧光通道渗色到另一个荧光通道的R程序进行处理。然后,它拟合了百分之五的逻辑模型以使用最大二阶导数法([Spiess2008])来估计Cp。所有样本和对照组复制地施加到PCR板上。复制孔中的Cp值在使用前取平均值。如果两个Cp值之间的差超过了3个单位,重复该样本。为提供跨越PCR板的标准化,Cp值表示为相对于20ng/μl参照RNA的ΔCp值(从汇集的细胞系衍生的RNA):ΔCp=Cp(样本)-Cp(参照RNA)统计分析MDK,CDC2,HOXA13,IGFBP5和IL8Rb的qRT-PCRΔCp值用于生成分类器,以基于线性判别分析或逻辑回归([Venables2002])分离含有TCC的样本和不含有TCC的样本。在这两种情况下,基因之间的相互作用在分类器模型中被允许。LDA的生成遵循标准程序,例如在"ModernAppliedStatisticswithS,4thedition"byW.N.VenablesandB.D.Ripley(2002),Springer中所述。任何不完整的数据被清理由研究而来的数据集,然后R统计环境(RDevelopmentCoreTeam(2009))和来自MASS包的函数“lda”(VenablesandRipley(2002))用于生成和测试临床试验数据的线性判别。逻辑回归分类器的生成以类似于生成LDA的方式实施。同样,不完整的数据被清理出研究数据。逻辑回归分类器使用R创建;不需要额外的软件包。逻辑回归依照如Dalgaard(2008)所述实施。分类器间的比较采用ROC曲线,使用R包,ROCR(Sing等人,2009)进行。使用Macskassy等人([Macskassy2005])的方法生成ROC曲线的置信区间。生成以下算法:线性判别分类器第一个分类器,线性判别,(称为LDA-3),是基于五个基因值(通过减去参考值归一化到参考值),其允许基因之间的多路相互作用。该分类器是使用从名为“MASS”包中的'lda()'函数内置在R中(Rversion2.9.1;MASSversion7.2-49)。该分类器是使用下面的方程式建立的:lda3<-lda(TCC.YN~MDK*IGF*CDC*HOXA*IL8R,data=uRNA.Trial)其中lda3是创建的模型;TCC.YN为由膀胱镜测定的“尿液中存在TCC”的真值(是或否);MDK,IGF,CDC,HOXA和IL8R是归一化的基因Cp值;uRNATrial是包含来自临床试验的5个基因和TCC.YN(是或否)中的每一个的Cp值的数据文件。公式中星号,'*',的使用表示乘法。分类器得分的估计过程为输入含有五个基因值以及分类器,lda3,的新数据帧,以输出分类器得分(score):Score<-c(predict(lda3,new.data)$x)其中,“score”是分类器用于预测TCC存在的输出;“lda3”是上面创建的分类器并且“new.data”是包含五个基因的测定值的数据文件,这五个基因用与在分类器创建中所用的相同的名字。该句法,`$x'和“c(...)”的存在是为了从由预测函数返回的大量信息中特定提取得分。设置得分的临界分数为0.112及以上,为尿样中存在TCCs设置我们的特异性为85%。LDA-3的系数示出在表6:表6逻辑回归分类器基于逻辑回归的第二个分类器来源于和LDA-3相同的清理过的数据集。然而代替使用lda()函数,我们使用统计包中的glm()函数(包括带有R的基础安装),如下所示:lr1<-glm(TCC.YN~CDC*IGF*HOXA*IL8R*MDK,family=binomial(“logit”),data=uRNA.Trial),其中,“lr1”是所创建的分类器,其它参数是如针对线性判别所描述的。再次,使用‘*’运算符指定全面互动。分类是以非常类似于对LDA-3的方式进行:score<-predict(lr1,new.data,type=′response′),其中,“score”是用于基于“new.data”中五个基因的测量值分类尿样的值,如上。lr1的临界分数被设定为0.102,以达到85%的特异性;临界分数的值被认为是TCC阳性。分类器的系数是:-103.0818143+3.9043769*CDC.d.R100+13.1120675*IGF.d.R100+17.4771819*HOXA.d.R100+-10.7711519*IL8R.d.R100+21.1027595*MDK.d.R100+-0.5938881*CDC.d.R100*IGF.d.R100+-1.0736184*CDC.d.R100*HOXA.d.R100+-1.3340189*IGF.d.R100*HOXA.d.R100+0.3126461*CDC.d.R100*IL8R.d.R100+1.4597355*IGF.d.R100*IL8R.d.R100+1.8739459*HOXA.d.R100*IL8R.d.R100+-1.035054*CDC.d.R100*MDK.d.R100+-2.5885156*IGF.d.R100*MDK.d.R100+-2.7013483*HOXA.d.R100*MDK.d.R100+1.4546134*IL8R.d.R100*MDK.d.R100+0.0767503*CDC.d.R100*IGF.d.R100*HOXA.d.R100+-0.0663361*CDC.d.R100*IGF.d.R100*IL8R.d.R100+-0.1015552*CDC.d.R100*HOXA.d.R100*IL8R.d.R100+-0.2110656*IGF.d.R100*HOXA.d.R100*IL8R.d.R100+0.1361215*CDC.d.R100*IGF.d.R100*MDK.d.R100+0.1601118*CDC.d.R100*HOXA.d.R100*MDK.d.R100+0.259745*IGF.d.R100*HOXA.d.R100*MDK.d.R100+-0.0106468*CDC.d.R100*IL8R.d.R100*MDK.d.R100+-0.1947899*IGF.d.R100*IL8R.d.R100*MDK.d.R100+-0.185286*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+0.0136603*CDC.d.R100*IGF.d.R100*HOXA.d.R100*IL8R.d.R100+-0.0151368*CDC.d.R100*IGF.d.R100*HOXA.d.R100*MDK.d.R100+0.0056651*CDC.d.R100*IGF.d.R100*IL8R.d.R100*MDK.d.R100+0.0030538*CDC.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+0.0232556*IGF.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100+-0.000867*CDC.d.R100*IGF.d.R100*HOXA.d.R100*IL8R.d.R100*MDK.d.R100结果尿样的qRT-PCR分析为获得IL8Rb对TCC检测的影响的综览,使用从患有TCC(n=56)或非恶性疾病尿石症(n=25),尿路感染(n=18)或膀胱炎(n=18)的患者的尿液获得的qRT-PCR数据,构建二维散点图。使用成对基因由四个基因标志物(MDK,CDC2,HOXA13,IGFBP5)构建散点图。然后IL8Rb代替每对中的一个基因,并且重新绘制数据。这些图在图2a-f中示出。在MDK散点图(图2a-c)中用IL8Rb代替IGFBP5和HOXA13示出了TCC患者和那些非恶性疾病患者的样本之间改进的分离。在CDC2散点图中用IL8Rb代替IGFBP5和HOXA13(图2d-f)观察到相同的趋势。然后IL8Rb对显见血尿患者的TCC正确诊断的贡献通过ROC曲线分析进行定量。标记物(MDK,CDC2,IGFBP5和HOXA13)和IL8Rb中的每个基因的qRT-PCR数据被用于开发线性判别算法,其将TCC患者和那些非TCC患者之间的判别最大化。使用整批442个样本:LD1,其使用来自MDK,CDC2,HOXA13和IGFBP5的qRT-PCR数据和LD2,其使用MDK,CDC2,HOXA13,IGFBP5和IL8Rb,来开发两个线性判别算法。然后LD1和LD2被用来生成ROC曲线,该曲线示出确诊患有TCC(n=56)或非恶性疾病尿石症(n=25),尿路感染(n=18)或膀胱炎(n=18)的患者组的TCC检测的灵敏度和特异性。图3a示出了LD1和LD2的ROC曲线。LD1的ROC曲线下的面积为78%,而LD2的ROC曲线下面积为84%。作为线性判别分析的替代,逻辑回归被用作独立的方法来开发用于判别TCC患者和那些非恶性疾病患者的算法。至于线性判别分析,逻辑回归算法采用整批442个样本开发。使用逻辑回归获得ROC曲线,上述56个TCC样本和61个非恶性样本示于图3b。LR1的ROC曲线下面积(使用来自MDK,CDC2,HOXA13和IGFBP5的qRT-PCR数据获得的)为80%,而LR2的ROC曲线下面积(使用来自MDK,CDC2,HOXA13,IGFBP5和IL8Rb的qRT-PCR数据获得的)为86%。该数据清楚地例示了将IL8Rb加入到利用尿样检测TCC的方法中可导致TCC患者和非恶性疾病,如膀胱炎,尿路感染和尿石症患者之间改善的判别。为确认由IL8Rb提供的、用于TCC患者和尿石症,尿路感染或膀胱炎患者之间的判别的改善的精度,这些患者被保持在一批未经选择的患者中,其包括更多的和更多样的非恶性患者,用表1中的整批442个样本重复ROC曲线分析。在此分析中,LD1和LD2的曲线下面积分别为86%和89%(图4a)。同样,LR1的曲线下面积为87%,LR2的曲线下面积为91%(图4b)。这个结果证实,IL8Rb导致使用尿样检测TCC中改善的精度。由于包含IL8Rb导致癌症检测中的此改善进一步通过在442个患者组中应用LD1/LD2和LR1/LR2进行例示,然后单独确定TCC的Ta阶段的检测的灵敏度。Ta阶段的肿瘤是更小、更分化的肿瘤,其通常比更高阶段的肿瘤更难检测。在85%特异性上,LD1检测到18/31(58%)的Ta肿瘤,而LD2检测到19/31(61%)的Ta肿瘤。LR1检测到21/31(68%),而LR2检测到24/31(77%)(85%特异性)。该数据表明,包含IL8Rb到LD和LR算法中提高了Ta阶段肿瘤的检测灵敏度高达9%。相比于这些RNA测试,这项研究中的其他三个膀胱癌试验示出了,检测Ta肿瘤的显著降低的精度:尿细胞学(39%灵敏度,94%特异性),NMP22ELISA(35%灵敏度,88%特异性)和NMP22(“美国,马萨诸塞州,Matritech,Inc.的注册商标”)(39%灵敏度,96%特异性)。IL8Rb作为尿道炎症诊断的辅助为了确定IL8Rb用于诊断由于如膀胱炎或尿路感染等原因患有尿道炎症的患者的能力,诊断为良性前列腺增生,非特异性前列腺病,血管性前列腺,继发于华法林使用的血尿,和膀胱炎/尿路感染的血尿患者的IL8RbmRNA尿液水平通过qRT-PCR确定。这些疾病中的每一个的平均IL8RbΔCt水平分别是-3.12,-3.10,-2.84,-1.98和-5.27。使用Wilcoxon秩和检验,确定患者膀胱炎/尿路感染和其它非恶性状态的组合病症的患者的IL8Rb水平的平均值之间的差异为显著(p=0.001)。描绘该数据的箱型图示于图5。该数据表明相比所检查的其他非恶性疾病的患者,IL8Rb水平在大多数诊断患有膀胱炎或尿路感染的患者中有升高。图表之间的重叠可能由三个因素的组合来解释:(ⅰ)标准临床实践无法正确地诊断每个疾病,(ⅱ)合并症(例如,感染和良性前列腺增生),和(iii)良性前列腺增生,非特异性前列腺疾病,血管前列腺或继发于华法林使用的血尿的患者子集中高尿嗜中性粒细胞计数的正常关联。无论如何,鉴于炎症和嗜中性粒细胞数之间的严格关联,尿液中IL8Rb的定量提供了检测尿路炎症的精确方法,无论是作为感染的后果或与其它非恶性疾病的关联。示例2方法研究群体在2008年4月28日至2009年8月11日之间在新西兰的9个泌尿外科诊所和澳大利亚的2个泌尿外科诊所,前瞻性地招募了一系列连续无TCC病史的患者。患者组包括示例1中所用的患者,但是还包括额外的46例患者,其数据没有用于第一个分析。进一步的研究还包括所获得的结果的进一步分析。样本的收集和RNA的收集和测试如示例1所述。RNA测试开发由四个mRNA标志物CDC2,HOXA13,MDK和IGFBP5组成。这些标志物是基于它们在血液和炎性细胞中的低表达以及在TCC中的过度表达被选择。在这个队列研究中,我们前瞻性指定线性判别算法(uRNA-D),其将四个标志物组合为单一的分数。uRNA-D是独立的,是在先前的数据集上开发出来的。然而,它不是使用代表测试针对的目标人口的严格特征患者组获得的。作为结果,该研究协议还定义了新的算法(分类器-D)的开发,用于使用从招募到当前队列研究的患者处获得的数据来使用五个标志物CDC2,HOXAI3,MDK,IGFBP5和IL8Rb。除了分类器-D,第二种算法(分类器-S)是使用队列研究数据获得的,以使能识别进展期(≥阶段1)或高度(WHO/ISUP1998年分类)的肿瘤。算法-S包括所有五个标志物,包括CDC2和HOXA13,其之前已经示出为在Ta阶段肿瘤和那些≥阶段1肿瘤之间被差异表达。分类器开发根据在本说明书中概述的方法,为使用五个标志物CDC2,HOXA13,MDK,IGFBP5和IL8RB开发两个分类器(分类器-D和分类器-S),是基于在本研究中获得的数据。简单地说,逻辑回归模型是使用统计编程环境R建立的(RDevelopmentCoreTeam(2011).R:Alanguageandenvironmentforstatisticalcomputing.RFoundationforStatisticalComputing,Vienna,Austria.ISBN3-900051-07-0,URLhttp://www.R-project.org/)。使用五个标志物的每一个的ΔCp值和它们的双向相互作用(例如,MDKxCDC2,MDKxIGFBP5等)建立的模型被评估其分类的能力;用留一法交叉验证程序估计具有最低AIC值的那些模型在特异度设为85%时的灵敏度。对分类器-D和分类器-S的每一个,几个模型展示了与选择最少数量的参数的模型相媲美的性能。统计方法诊断测试是在协议中规定的,为灵敏度和特异性计算出比例和95%置信区间。使用Stataroctab和roccomp命令(Statacorp和Delong)画出并比较接受者操作特性(ROC)曲线。对于分类器-D,置信区间不合适,但Fisher精确检验或卡方检验(当样本大小允许时)被用来测试TCC或患者的特性及真阳性或假阳性结果可能性之间的关联。逻辑回归模型用于探索与假阳性和假阴性结果相关的因素。所有分析均在Stata11.2版中实行。结果本研究最初共招募517例患者;,4%的患者被排除,因为发现他们是不合格的(n=10),没有经过膀胱镜检查的(n=9),TCC状态不合规定(n=2),或者他们没有提供可接受的尿样(n=2)(图8)。另外10例患者从分析中排除,因为他们没有一个或多个尿测试的结果。剩余的485例患者的基线人口统计学和临床特征示于图9。队列中TCC的患病率为13.6%。两例错过复查阶段(两例都是当地复查为Ta),两例都没有给定复查级别(一例为当地病理学家诊断1级,另一例为低级)。66例肿瘤中,55例是浅表的(Ta,T1或Tis阶段),11例为肌层浸润性(T2)。没有患者具有可检出的区域淋巴结转移或加入。使用1973分级系统,24例被分类为3级,38例为2级,3例为1级和1例未知。使用WHO98系统,29例被分类为高级,4例混合,32例低级和1例未知。除了TCC,两例患者被诊断为乳头状瘤,七例诊断为其他肿瘤(其中五例是泌尿外科的)。uRNA-D测试的临界值是在特异性设定在85%的研究队列上确定的。根据此临界值,相比于NMP22TMELISA(50%),(38%)和细胞学(56%),uRNA-D检测到66个TCC病例中的41个(62%灵敏度)。在队列数据分类器-D上开发的RNA测试在85%的特异性检测到TCC病例中的54个(82%),在90%的特异性检测到48个(73%)。uRNA-D和NMP22TMELISA值可以直接比较,因为这两个测试在本研究之前得到充分说明。图21示出ROC曲线;曲线下面积(AUC)分别为0.81和0.73(p=0.03)。分类器-D的ROC曲线为0.87(图21),并相对于uRNA-D的性能改善似乎主要是在临床上相关的特异性范围内(80%以上)。总体上,分类器-D检测出的高级/3级肿瘤的97%,相比于uRNA-D(83%),细胞学(83%),NMP22ELISA(69%)和(38%)。相比于其他测试的范围为28-41%(图12),分类器-D也对检测低级肿瘤(69%)更灵敏。分类器-D对所有阶段≥1加两个Tis的TCC病例为阳性,但是对Ta阶段灵敏度为68%(p=0.016,图12)。这仍然大大高于其他测试,uRNA-D是第二高的,为41%。相比那些没有肉眼可见血尿或显微可见血尿(p<0.0005)的TCC患者,尿样中明显具有肉眼可见血尿或显微可见血尿的TCC患者更可能通过加入IL8Rb检测到其TCC,尽管这可能至少部分是肉眼可见血尿或显微可见血尿患者中高阶段和高级TCC的比例较高的结果。数目不足以在回归分析中做进一步探讨。分类器-D错过的12个病例中,所有均为Ta阶段的,并且除了1个外,其余均是低级的(WHOISUP1998)。12个中只有2个(均为低级,Ta阶段的TCC)是被另一个测试检测出的(1个由NMP22TMELISA和一个由uRNA-D)。分类器-D错过的12个病例中,所有均为Ta阶段的,并且除了1个外,其余均是低级的(WHOISUP1998)。12个中只有2个(均为低级,Ta阶段的TCC)是被另一个测试检测出的(1个由NMP22TMELISA和一个由uRNA-D)。细胞学没有检测到分类器-D错过的任何TCC。患者A:高级肾盂肿瘤T2,没有并发Tis,没有给定大小。患者B:高级膀胱肿瘤T3a,没有并发Tis,2x3cm患者C:高级肿瘤,测量4.8×5.6cm,具有大面积的基质和肌层浸润,延伸至膀胱周的脂肪,无转移的证据。那些采用替代诊断的患者中,根据尿样特性的尿液测试的特异性示于图13。肉眼可见血尿或显微可见血尿的控制组患者比没有肉眼可见血尿或显微可见血尿(p=0.002)的患者更可能有假阳性测试,并且有一个趋势,即患者可能还有结石,虽然通过诊断特异性的差异整体上统计上不显著(p=0.12)。有5例具有其他泌尿癌症的患者;其中只有一个给出了阳性的分类器-D测试结果。拟合逻辑回归模型的结果是相似的。在诊断和肉眼可见血尿或显微可见血尿的逻辑回归模型中,与肉眼可见血尿或显微可见血尿状况的相关性仍然显著(p=0.006),并且当直接相比于无诊断时,结石患者具有2.7倍增加几率的假阳性测试(95%CI(1.1至6.4),p=0.03)。年龄不影响测试的特异性。尿样中检测出的肉眼可见血尿或显微可见血尿是与测试灵敏度明显相关的唯一因素。在这个队列中那些肉眼可见血尿或显微可见血尿患者的阳性测试的预测值是63%,那些没有肉眼可见血尿或显微可见血尿患者的阳性测试的预测值是24%,这主要反映了肉眼可见血尿或显微可见血尿患者中更大的TCC患病率(39%对6%)。有54例TCC患者的分类器-D测试为阳性。这些患者采用分类器-S分类为严重TCC和不严重TCC。严重TCC定义为阶段≥1或任何阶段的3级。在90%的特异性,分类器-S正确分类32/35(91%)的严重TCC病例。示例3:血尿I期患者的基因型和表型组合分析本研究着重于呈现确诊无症状镜下血尿(AH)的患者,其正在经历对可能的尿路上皮癌(UC)的全面临床病情检查。约500例患者被招收到参与了这项研究。如本说明书中所用,术语在额外的示例中定义如下。目标目标用于确定:(1)在计划进行全面泌尿外科临床病情检查的呈现显微可见血尿的患者中基因型和表型算法的疗效,(2)用于在呈现确诊镜下血尿患者中检测初级UC的基因型和表型算法G+P指数的性能特点(灵敏度,特异性,ROC曲线下面积,阳性和阴性预测值);(3)由基因型和表型工具G+P指数正确诊断为UC阴性的患者的数量,他们因此不需要调查性的膀胱镜检查。研究群体研究群体包括呈现确诊显微可见血尿的患者,其满足研究的要求。患者是从由全科诊所转介到泌尿外科诊所的患者中招募的。知情同意计划进行调查性的膀胱镜检查的患者被接触,以讨论可能的参与。患者被告知研究的性质并且得到同意。患者提供人口统计,职业和吸烟史的信息,并在提供尿液样本之前,确保他们充分了解患者信息和知情同意书。研究协调员完成详细介绍基因型和表型指数的相关输入信息的CRF页并传输数据进行分析。纳入标准随后正在进行尿路上皮癌膀胱镜调查的患者被确诊在2或3个妥善收集的尿液样品上临床发现镜下血尿(每高倍视野(HPF)至少3个RBC)。病人愿意遵守研究要求。患者已年满18岁。排除标准尿路上皮癌(UC)病史。当前呈现肉眼可见血尿。确诊(恶性或其他)的肉眼可见血尿发作期的病史(过去12个月)。G+P指数我们开发了新的指数,“G+P指数”,其包括基因型和表型数据两者的组合。基因型(“G”)组成部分利用RNA生物标志物表达信息,与收集自相同时间窗口中的患者的五个临床因素(表型数据“P”)一起使用,以确定AH患者的UC风险。所有患者接受标准的临床病情检查以确定真实的临床结果,并且该研究的输出是以所收集的临床数据和收集自患者尿样的基因型数据为基础的模拟输出。这样,患者护理不会因研究输出的结果而改变。患者提供尿样,其被送去用于遗传分析。患者归类参与本研究的患者的总体护理标准没有变化。根据当前护理标准,所有计划进行全面泌尿科病情检查的患者接受适当的调查。研究数据人口统计学和风险因素信息是基因型和表型指数是输入数据。最终的疾病状态(由灵活的膀胱镜检查和后续检查确定)用(Φ)结果和人口统计信息进行校对,并进行统计分析。G+P指数的确定使用从收集自大量新西兰和澳大利亚站点收集的约500个患者的样本获得的数据集,预测“TCC=yes”可能性的训练模型被开发。收集用于训练和验证群体的变量的数据表型变量临床研究结果是:性别,年龄,吸烟史,和HFREQNEW(<=1表示低;>1表示高)。基因型变量基因型变量包括RNA标志物:M1(=MDK+CDC+IGBP5-HOXA13)和IL8R的表达。下面的表7示出验证G+P指数的因素中的每一个的系数的估算值:表7图18描绘了G+P指数的ROC曲线。图18是根据本发明的实施例的结果的灵敏度(纵轴)对1-特异性(横轴)的图。为了比较,对角线描绘了模型。单独基于表型信息的结果被示为点划线,单独基于基因型信息的结果被示为虚线,基于G+P指数的结果被示为实线。这些结果表明,基因型和表型信息的组合提供了对预测结果的出人意料的、显着的改善。探索模型考虑7个表型变量,但AgeGT50表现影响不大,而RBC数据不足,所以这两个变量从最终模型中去掉。在剩余的五个表型变量和两个RNA标志物的显著性水平基础上,构建一个指数。使用训练数据集中M1,IL8R和TCC(=yes)之间的相互关系,阈值4.5和2.5分别用于M1和IL8R。得分5,4,3,2和1被分配到M1,吸烟者,男,IL8R和HFREQ—这导致指数得分范围从0到15。基于系数的合成算法如下,所组合的G+P指数为:G+P指数=(1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)被保留在最终模型中的不同临床因素的比值比示于图19。比值比可以依赖于它偏离1(即,没有影响)多远被解释为具有对受试者有害或保护的作用。比值比,其置信界限不包括1,是统计显著的。通常,相比于具有小比值比的因素(例如HFREQ),具有较高比数比的因素(例如SMK,Gender)被分配较大的权重。完整模型的分类表示于下面表8中。表8G+P指数的初步验证研究为了进一步测试G+P指数的使用,我们进行了另一项研究。基于各种临床和RNA标志物的统计显著性,构建一个指数。共有98名受试者,其TCC状态(yes或no)以及G+P指数的变量是可用的。得分5,4,3,2和1被分配到M1(基因测试),吸烟者,男,IL8R和HFREQ—这导致指数得分范围从0到15。真阳性和真阴性的数量分别为6和84。同样,假阳性和假阴性的数量分别为5和3。因此,所提出的指数的总体精度为0.92。基于G+P指数的含义及跟进如果G+P指数结果表明UC“高风险”定义为得分11-15或以上,患者具有接受临床指示的灵活的膀胱镜检查和腹部超声的优先权。如果G+P指数结果表明UC“中风险”定义为得分6-10,患者要接受复查和临床实践的随访。可以考虑使用细胞学,输尿管镜和/或CT扫描。如果G+P指数结果表明UC“低风险定义为得分0-5的”,患者将接受正常标准护理,并被放置在适当的等候名单上。参考文献下列参考文献涉及到上面的公开内容。Agresti,A.andCoull,B.A.(1998)Approximateisbetterthan"ex-act"forintervalestimationofbinomialproportions.TheAmericanStatistician,52,119-126.AltekruseSF,KosaryCL,KrapchoM,NeymanN,AminouR,WaldronW,RuhlJ,HowladerN,TatalovichZ,ChoH,MariottoA,EisnerMP,LewisDR,CroninK,ChenHS,FeuerEJ,StinchcombDG,EdwardsBK(eds).SEERCancerStatisticsReview,1975-2007,NationalCancerInstitute.Bethesda,MD,http://seer.cancer.gov/csr/1975_2007/,basedonNovember2009SEERdatasubmission,postedtotheSEERwebsite,2010.Brown,L.D.Cai,T.T.andDasGupta,A.(2001)Intervalestimationforabinomialproportion.StatisticalScience,16,101-133.Buckhaults等人,(CancerResearch61:6996-7001(2002)describescertainsecretedandcellsurfacegenesexpressedincolorectaltumours.Byrd,R.H.,Lu,P.,Nocedal,J.andZhu,C.(1995)Alimitedmemoryalgorithmforboundconstrainedoptimization.SIAMJ.ScientificComputing,16,1190-1208.Dalgaard(2008)."IntroductoryStatisticswithR,2ndedition";PeterDalgaard,Chapter13(2008),Springer,ISBN978-0-387-79053-4.DeLong,E.R.,D.M.DeLong,andD.L.Clarke-Pearson.1988.Comparingtheareasundertwoormorecorrelatedreceiveroperatingcharacteristiccurves:Anonparametricapproach.Biometrics44:837-845.Gottschalk,P.G.andDunn,J.R.(2005)Thefive-parameterlogistic:Acharacterizationandcomparisonwiththefour-parameterlogistic.AnalyticBiochemistry,343,54-65.Doi:10.1016/j.ab.2005.04.035GrossfieldG,WolfJ,LitwanM,HricakH,ShulerC,AgerterD等人.Asymptomaticmicroscopichematuriainadults:summaryofAUAbestpracticepolicyrecommendations.AFP2001:63:1145-54.Halletal(Laryngoscope113(1):77-81(2003)(PMID:12679418)(Abstract)describedpredictivevalueofserumthyroglobulininthyroidcancer.Hoerl,A.E.(1962)Applicationofridgeanalysistoregressionproblems.ChemicalEngineeringProgress,58,54-59.HolyoakeA,O'SullivanP,PollockR,BestT,WatanabeJ,KajitaY等人.DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes.2008Feb1;14(3):742-9.Hotte等人,(AJ.AmericanCancerSociety95(3):507-512(2002)describesplasmaosteopontinasaproteindetectableinhumanbodyfluidsandisassociatedwithcertainmalignancies.Kim等人,(JAMA287(13):1671-1679(2002)describesosteopontinasapotentialdiagnosticbiomarkerforovariancancer.Koopman等人,(CancerEpidemiol.BiomarkersPrey13(3):487-491(2004)(Abstract)describesosteopontinasabiomarkerforpancreaticadenocarcinoma.Kuo等人(Clin.Chim.Acta.294(1-2):157-168(2000)(Abstract)describesserummatrixmetalloproteinase-2and-9inHCF-andHBV-infectedpatients.Leman等人,(Urology,69(4)714-20(2007)(Abstract)describesEPCA-2asaserummarkerforprostatecancer.LooR,LiebermanS,SlezakJ,LandaH,MarianiA,NicolaisenG,AsperaAandJaconsenS:Stratifyingriskofurinarytractmalignanttumorsinpatientswithasymptomaticmicroscopichematuria.MayoClinProc.2013,88(2);129-138.Lunn,D.,Spiegelhalter,D.,Thomas,A.andBest,N.(2009)TheBUGSproject:Evolution,critiqueandfuturedirections(withdiscussion),StatisticsinMedicine28:3049-3082.Marchi等人,(Cancer112,1313-.1324(2008)(Abstract)describesProApolipoproteinAlasaserummarkerofbrainmetastasesinlungcancerpatients.Martin等人,(ProstateCancerProstaticDis.March9,2004(PMID:15007379)(Abstract)describeduseofhumankallikrein2,prostate-specificantigen(PSA)andfreePSAasmarkersfordetectionofprostatecancer.Mazzaferri等人,(J.Clin.Endocrinol.Metab.88(4):1433-1441(2003)(Abstract)describesthyroglobulinasapotentialmonitoringmethodforpatientswiththyroidcarcinoma.McDonaldM,SwagertyD,WetzelL:AssessmentofMicroscopichematuriainadults.AFP200673:10.Melle等人,(Clin.Chem.53(4),629-635(2007)(Abstract)describesHSP27asaserummarkerforpancreaticadenocarcinoma.More,J.J.(1978)TheLevenberg-Marquardtalgorithm:implementationandtheory,inLectureNotesinMathematics630:NumericalAnalysis,G.A.Watson(Ed.),Springer-Verlag:Berlin,pp.105-116.Nelder,J.A.andMead,R.(1965)Asimplexalgorithmforfunctionminimization.ComputerJournal7,308-31.O'SullivanP,SharplesK,DalphinM等人:AMultigeneUrineTestfortheDetectionandStratificationofBladderCancerinPatientsPresentingwithHematuria.JUrol2012,Vol188No3;746Pellegrini等人,(CancerImmunol.Immunother.49(7):388-394(2000)(Abstract)describesmeasurementofsolublecarcinoembryonicantigenandTIMP1asmarkersforpre-invasivecolorectalcancer.(RDevelopmentCoreTeam(2009).R:Alanguageandenvironmentforstatisticalcomputing.RFoundationforStatisticalComputing,Vienna,Austria.ISBN3-900051-07-0,URLhttp://www.R-project.org/)Richards,F.J.(1959)Aflexiblegrowthfunctionforempiricaluse.JournalofExperimentalBotany.10,290-300.Rudland等人,(CancerResearch62:3417-3427(2002)describesosteopontinasmetastasisassociatedproteininhumanbreastcancer.Sing等人(2009).(TobiasSing,OliverSander,NikoBeerenwinkelandThomasLengauer(2009).ROCR:Visualizingtheperformanceofscoringclassifiers..Rpackageversion1.0-4.http://CRAN.R-project.org/package—ROCR).Speiss,A.-N.,Feig,C.andRitz,C.(2008)HighlyaccuratesigmoidalfittingofrealtimeRCRdatabyintroducingaparameterforasymmetry.BMCBioinformatics,9,221.Doi:10.1186/1471-2105-9-211.SprengerH,LloydAR,LautensLL,BonnerTI,KelvinDJ.Structure,genomicorganization,andexpressionofthehumaninterleukin-8receptorBgene.JBiolChem.1994Apr15;269(15):11065-72.StataCorp.2009.StataStatisticalSoftware:Release11.CollegeStation,TX:StataCorpLP.SchwartzG:Properevaluationofasymptomaticmicroscopichematuriaintheeraofevidence-basedmedicine-progressisbeingmade.MayoClinProc.2013,88(2);123-125.TrivediCandMessingEM:Commentary:theroleofcytologicanalysisofvoidedurineinthework-upofasymptomaticmicrohematuria.BMCUrology2009,9:13Tsigkou等人,(IClinEndocrinolMetab,92(7)2526-31(2007)(Abstract)describestotalinhibinasapotentialserummarkerforovariancancer.Venables,W.N.&Ripley,B.D.(2002).ModernAppliedStatisticswithS.FourthEdition.Springer,NewYork.ISBN0-387-95457-0).Whitley等人,(DimLab.Med.24(1):29-47(2004)(Abstract)describesthyroglobulinasaserummarkerforthyroidcarcinoma.Yoshikawa等人,(CancerLetters,151:81-86(2000)describestissueinhibitorof30matrixmetalloproteinase-1inplasmaofpatientswithgastriccancer.示例4:使用G+P指数II归类呈现血尿的患者当G+P指数值在11至15的范围时,G+P指数指示阳性。定义如在本说明书中使用的,下列定义用在此处和下面的示例中。“AMH”是指无症状显微可见血尿;“AUA”是指美国泌尿学协会;“AUC”是指曲线下面积;“CI”是指置信区间;“CT”是指计算机断层扫描;“ELISA”是指酶联免疫吸附测定;“FISH”是指荧光原位杂交;“HPF”是指高倍视野;“logOR”是指对数比值比;“Hfreq”是指最近血尿发作时血尿的日均频率;“ISUP”是指泌尿病理学国际协会;“MRI”指核磁共振成像;“NPV”指阴性预测值;“OR”表示比值比;“QC”是指质量控制;“QoL”是指生活质量;“表型(Phenotypic)”是用来定义临床预测的特征并将它们与已被广泛地定义为“基因型”变量的基于基因表达的生物标志物区分开。“RBC”指红细胞;“ROC”是指接受者操作曲线;“RT-qPCR”是指定量逆转录聚合酶链反应;“STARD”是指报告诊断精度的标准;“UC”是指尿路上皮癌;“WHO”是指世界卫生组织。简介血尿,其与例如良性前列腺肿大,感染或尿路结石这些原因最经常相关联,但也是尿路上皮癌(UC)的症状,估计一般人群中在1%和22%之间的患者会发生血尿[1,2]。肉眼可见血尿的特征在于患者尿中可见的颜色变化,而显微可见血尿更精确地定义为在3个同时收集的尿样中每高倍视野中存在≥3个红细胞(RBCs/HPF)[2]。显微可见血尿患者中UC的总体发病率已经被报道为约4%,而一些研究一致表明,UC的发病率在肉眼可见血尿的患者中要高得多,范围约为12%-23%[2-6],在泌尿评估中肉眼可见血尿患者的UC发病率达到显微可见血尿患者UC发病率的近四倍[7]。值得注意的是,鉴于美国泌尿学协会(AUA)准则的最近变化[2],已经看到无症状血尿(AMH)的阈值降低至单个样本中≥3RBCs/HPF,并且甚至更低的阈值(≥1RBC/HPF)已经被提出[8],因此将接受泌尿病情检查以调查潜在UC的患者的数量相应增加,并且可预期这些患者对医疗保健系统的整体临床和经济负担相应增加。这种血尿相关的转诊给泌尿科带来了显著的临床负担,因为所有患者必须进行全面的病情检查以提供通常无确定结果的诊断。此外,现有的诊断测试—其中许多是侵入性或具有能够对患者生活质量(QoL)产生不利影响的高辐射负载,特别是如果依照当前指南授权的,患者接受重复的膀胱镜检查[2]。据报道,对于没有预防性抗生素实施膀胱镜检查,22%的患者患有无症状菌,1.9%的患者在30天内发展成发热性尿路感染(UTI)[9]。其他研究也报道了膀胱镜检查之后,肉眼可见血尿,排尿疼痛和男性的短暂勃起功能障碍的患病率较高[10,11]。作为血尿患者接受全面的泌尿病情检查的结果,医疗保健系统也遭受显著的经济负担[12,13],而且已得出结论,尿细胞学检查增加了成本,但没有提供任何显著的诊断益处[14-16]。因此,融合精确的、非侵入性的测试到呈现血尿患者的初级临床病情检查允许医生有效地归类血尿患者,从而降低为检测UC而接受全面泌尿病情检查和调查性膀胱镜检查的患者数目,并提供给患者和医疗保健系统显著的好处[15-19]。一些临床预测的特征,包括年龄,性别,吸烟史及血尿程度,是公认的血尿患者的UC危险因素[3,20-22]。最近,一些团体试图基于临床预测特征来开发预测血尿患者UC风险的模型[20-22],但关键是,这些模型提供了有限的精度且大都集中在检测UC患者而不是排除没有疾病的患者。因此,即使与尿细胞学组合使用,这些关注检测的模型已经不足以在初期评估期间可靠地确定患病的患者[20-22]。尽管呈现肉眼可见血尿患者中UC发病率较高,但是多项研究显示与那些呈现肉眼可见血尿的患者相比,呈现显微可见血尿的患者在UC的分级和分期的分布上无显著差异[5,23-25]。因此,AUA建议所有肉眼可见血尿患者或AMH患者均转诊到泌尿科接受全面的泌尿病情检查,因为血尿的严重程度不足以预测UC的存在[2]。然而,因为在初期评估中,血尿患者可能仅经历有限的尿液分析,包括细胞学和在一些情况下成像研究,例如超声波,所以全面的泌尿病情检查通常是必要的,以决定性地检测到或排除UC。虽然尿细胞学检查被目前的指南指定并且常规地用于疑似UC患者,但是细胞学检查结果往往是非典型或可疑的尚无定论的结果,并且饱受UC相关血尿患者假阳性结果的相对较高风险带来的低诊断率的苦果[2,26,27]。因此,可能很难在初期评估期间排除血尿的良性原因,无论是肉眼可见血尿或AMH,尤其是如果UC相关血尿是间歇性的并在针对良性原因的治疗后似乎痊愈的[12]。许多基于基因的研究已经开始描述UC患者的尿液生物标志物,并且这些生物标志物可以凭自身的能力对检测疾病是有用的[28,29]。也存在机会基于患者的临床特征和基因表达谱对患者归类。与单独的临床特征相比,将NMP22酶联免疫吸附测定(ELISA)测试或一组基因标志物与临床特征组合已经显示出可以提高诊断的准确性,但是这些组合模型尚未在整体诊断准确性上带来显著的进步,特别是当试图识别低风险患者时[30,31]。尽管如此,将临床因素和特异性基因表达结合为组合的算法被认为可能为诊断和管理血尿或UC患者提供最好的指导[32]。CxbladderTMDetect(新西兰,达尼丁,PacificEdgeLtd.),在未分馏的尿液上进行多基因测试之前已经显示出比尿细胞学和NMP22在肉眼可见血尿患者中检测UC更灵敏[33]并且在比较分析中,比尿细胞学,NMP22和荧光原位杂交(FISH)更准确(Kasabov,Darling,Breen等人,未发表的言论)。CxbladderDetect使用定量逆转录聚合酶链反应(RT-qPCR)技术来定量5个mRNA标志物,四个标志物在UC中过度表达,同时第五个标志物在非恶性炎性病症中升高,并且当用于检测呈现血尿的患者中的UC时,CxbladderDetect提供高水平的特异性和灵敏度[33]。据推测,结合收集自同一患者的高性能的遗传标志物和表型变量的综合模型将使用高灵敏度(即UC患者接收假阴性结果的低可能性),高阴性预测值(即所有阴性结果是真实的比例高)和高测试阴性率提供卓越的临床解决方案,以使能精确归类具有UC低概率的患者。当将这些基因型和表型变量组合成新的偏析模型时,能够使具有UC低概率的血尿患者被识别和归类,而不是经历全面的泌尿病情检查。方法患者的选择695例患者的前瞻性样本用于分析,其中采用传统的临床评估确定真实的临床结果。研究样本包括血尿患者的初始队列如前所述得到同意并取样[33],其中一系列连续的517例近期肉眼可见血尿病史,年龄≥45岁,没有UC病史的患者从澳大利亚和新西兰的9个泌尿诊所前瞻性招募。这些患者被随访三个月用于确定UC状态或在尿液样本多基因分析后给出替代诊断,阳性的UC诊断是基于膀胱镜外观和组织病理学检查。采用1998年世界卫生组织(WHO)/泌尿病理学国际协会(ISUP)的共识分类,疾病的阶段根据病理和影像诊断调查确定的TNM分期标准分类,肿瘤分级是按照当地的病理学实践进行划分的[34]。肉眼可见血尿事件后,正在接受泌尿外科调查的另外的94例患者和84例患者的队列随后在2012年3月和2013年4月之间从新西兰的两个中心被招募并包括到模型开发中。在他们之前参加最初的研究的经验及在个人临床环境中评估CxbladderDetect产品的意愿基础上,所述中心被选择参与其中。另外的代表性测试集的45例呈现显微可见血尿的患者被前瞻性地集合并用于对G+P指数的进一步验证,具体如下。合格标准是与[33]相似的,除了患者年龄≥18岁外,那些曾经历了膀胱镜检查以调查UC,并被证明是阴性的,也有资格入选。此外,如在[33]中,显示出指示为UTI或膀胱或肾结石症状的患者,被排除在外。这项研究的伦理批准是由所有参与的中心通过的,并且提供样本的所有患者签署了知情同意书。尿样收集和评估为了提供基因表达数据,使用来自PacificEdge的尿液取样系统收集参与者的单一中段尿样。所有研究样本的多基因分析是根据标准操作程序进行的,如同用于商售的CxbladderDetect多基因测试。来自最初的队列的所有尿样(4.5mL)是膀胱镜检查之前在诊所被收集的,并且经由真空驱动抽吸转为稳定液体,然后在48小时内送到PacificEdge。之后将样本储存于-80℃,直到需要进行批量分析。之后队列的样本以同样的方式进行收集,但是根据PacificEdge诊断实验室实行的修订的质量控制(QC)限制和容限测试,样本在环境温度下运送到PacificEdge并在收集的7天内进行处理。统计分析单变量逻辑回归用来估计与UC相关的4个二进制表型变量的未调整(原始)对数比值比(logOR)系数:性别,吸烟史和患者最近的血尿发作期间血尿的日均频率(Hfreq;参见表9)。表9:与UC相关的二进制表型变量的定义和其相应得分对所有四个表型变量的多变量逻辑回归被用来生成表型模式(P指数)中的调整logOR系数。使用逻辑回归来开发G指数,以确定UC和尿样中五个Detect基因(IGFBP5,HOXA13,MDK,CDK1和CXCR2)的mRNA浓度之间的相关性。使用来自G指数和P指数的所有九个变量的组合生成多变量基因型—表型模型(G+P指数)。这些线性模型确定logOR,患者患有UC的概率可以从logOR导出。每个模型的相对表现在绘出如每个模型确定的测试UC时的假阳性率对真阳性率的接受者操作曲线(ROCs)中说明。曲线下面积(AUC)用来将每个模型的相对效率与被认为接近l是最佳的AUC做对比。当对相同的数据集执行模型估计和预测时,为了减少潜在的偏差,使用自举重复采样[35]为三个逻辑回归模型中的每一个计算偏差修正的AUC。来自原始样本的名义AUC和来自自举样本的平均AUC之间的差值是样本偏差的估计值,并且名义AUC进行相应调整。也得到偏差修正置信区间(CIs)自举估计值[36]。此外,每个模型的性能特点必须超过0.97的NPV阈值,其为此临床测试的设计标准,采用具有高测试阴性率的进一步附加说明而具有尽可能高的灵敏度。当归类(triaging)出具有UC低概率的呈现血尿的患者时,选择测试阴性率以提供较高的临床解决方案。在G指数,P指数和G+P指数之间作比较,并且根据灵敏度和具有足够高的测试阴性率的NPV确定每个模型的性能,以提供用于归类(triaging)出具有UC低概率的血尿患者的有效工具。结果样本人口跨三个队列登记的695例肉眼可见血尿例患者中,由于缺乏足够的数据或者样本而未能达到QC标准,23例被认为不合格,并且来自另外85例患者的样本在注册后被排除(参见图20A)。总计,来自587例患者的样本可用于为包括72例UC阳性和515例UC阴性的样本建模。在提供的来自显微可见血尿患者的45个样本中,40个适合于分析,5例患者被认为不合格,并从分析中排除(参见图20B)。所有45例患者接受了全面的泌尿评估而且临床事实被确认为UC阴性。来自两个样本群体的全部人口统计数据列于表10。表10:肉眼可见血尿和显微可见血尿患者的采用完整数据的样本群体人口统计特征肉眼可见血尿患者的表型变量和UC风险的关系四个二进制表型变量的每一个的未调整的单变量逻辑回归分析表明,年龄≥60岁,男性,吸烟史和肉眼可见血尿的高频率均与UC的风险增加相关(表11)。表11:血尿患者通过表型和基因型因素UC的未调整和调整的OR调整的P指数,G指数和G+P指数变量OR分别是P指数,G指数和G+P指数的取幂系数。用多变量逻辑回归模型计算调整的logOR系数。P指数=-3.78+0.81×Age+0.46×Gender+0.78×Smokinghistory+0.59×Hfeq如表9指定的,其中每个表型变量被分配给二进制得分0或1,并且系数的置信区间在表11给出。P指数的AUC的偏差修正估计值为0.66(95%CI:0.55-0.67;图21)。肉眼可见血尿患者的基因型变量与UC风险之间的关系G指数使用尿样中的五个基因IGFBP5,HOXAI3,MDK,CDKI和CXCR2的mRNA浓度的对数通过逻辑回归进行估算以预测UC的发生。G指数=-6.22+0.77×IGFBP5-1.11×HOXA13+1.56×MDK+1.24×CDK1-0.43×CXCR2G指数给出0.83的偏差修正AUC(95%CI:0.74-0.89;图21)。肉眼可见血尿患者的基因型和表型变量与UC风险之间的关系然后五个连续基因型变量与四个二进制表型变量组合,以使用多变量逻辑回归估算G+P指数。G+P指数=-8.46+(0.79×IGF-1.60×HOXA+2.10×MDK+0.95×CDC-0.38×IL8R)+(0.64×Age+1.11×Gender+0.98×Smokinghistory+0.56×Hfeq)G+P指数给出0.86的偏差修正AUC(95%CI:0.80-0.91)。G指数和G+P指数的比较G指数和G+P指数的置信区间之间有重叠,所以配对测试的自举版本是通过确定每个自举样本的G指数和G+P指数的AUC的差构建的。通过从可用于分析的原始587个样本随机抽样替代原始样本来生成样本大小n=587的一万个自举样本。模型之间的差异所产生的95%CI为0.01-0.08。因此,两个AUC之间的真实差小于0.01的概率<0.025,这表明G+P指数的AUC显著大于G指数的AUC的可能性高。模型的NPV和灵敏度G+P指数在测试阴性率从0.2到0.7的范围内产生NPV>0.97,并且几乎总是高于G指数模型的NPV(图22)。当测试阴性率为0.4时,G+P指数提供敏感性为0.95和NPV为0.98的性能特征(表12;图22)。与此相反,当测试阴性率为0.4时,G指数只达到0.86的灵敏度和NPV0.96(表12)。表12:当为改变测试阴性率设置阈值时,每个模型的性能特征G+P指数在显微可见血尿患者中的应用虽然G+P指数是使用来自肉眼可见血尿患者的数据开发的,但它的稳健性在来自显微可见血尿(Hfreq=0)患者的另外40个样本中被测试。预期在显微可见血尿群体中测试阴性率更高,因为UC的发病率在该群体中较低,并且使用0.4的测试阴性率,32(80%)例患者测试为阴性并将被正确地归类出来,因此不需要全面的泌尿外科病情检查以确定UC。讨论本研究定义了一个临床工具,其提供给临床医生和医师为了UC检测有效地从需要进行全面的泌尿病情检查中归类出呈现血尿患者的能力。该研究提出了采用基于自举的CI估计值的内部验证的基因型—表型模式,G+P指数,其提供了高灵敏度和高NPV(即个别UC患者的低概率提供了假阴性结果,而所有阴性结果的高比例为真)的组合,该组合不是排他地单独由基因型或表型数据得到的模型所提供的。这为临床医生和医师提供了一个独特的机会,来归类出肉眼可见血尿和显微可见血尿患者,特别是通过识别不需要全面的泌尿外科病情检查的具有UC低风险的患者。在高灵敏度情况下的高测试阴性率是有效的归类测试的重要考虑因素,归类测试旨在引导UC低概率患者远离全面的临床病情检查[37]。因此,在0.4的测试阴性率时,这里提出的G+P指数的灵敏度最大化了灵敏度和NPV两者(分别为0.95和0.98)。这可以与选自[33]中公开的基因型模型中的最佳拟合(灵敏度=0.82;NPV=0.97)作比较,并且也是与膀胱镜检查(灵敏度=0.89-0.98;NPV=0.99)和使用计算机断层(CT)扫描或磁共振成像(MRI)的虚拟膀胱镜(灵敏度分别为0.94和0.91)两者的灵敏度和NPV可比较的[38-40]。应当承认,在这种情况下用来推导G指数,P指数和G+P指数的样本群体由肉眼可见血尿患者组成。然而,在0.4的测试阴性率下,这个对肉眼可见血尿患者测试的高灵敏度允许G+P指数被应用在肉眼可见血尿和显微可见血尿群体两者上。假定有UC和没有UC的患者类似地分布在显微可见血尿和肉眼可见血尿患者群体中,因为在显微可见血尿群体中为4%的预期UC发病率,也可以在显微可见血尿患者人群中预期高NPV。通过将G+P指数应用到没有UC的显微可见血尿患者的样本群体上,已表明基于结果,80%的患者会被归类出来。只有20%的会被转诊做全面的泌尿科病情检查。这与传统指南相比,目前看到所有不能归因于良性原因的显微可见血尿患者(100%)均要经历全面的泌尿科病情检查,招致不必要的重大成本并负面影响患者的QoL。血尿的严重程度与患者患有UC的概率相关,但与任何肿瘤的阶段或等级无关,估计转诊到泌尿科的分别为96%的显微可见血尿患者和77-88%的肉眼可见血尿患者没有UC[2-6]。因此,避免血尿患者的潜在地不必要的泌尿外科病情检查有几个好处。膀胱镜检查可与副作用,例如排尿疼痛,出血,尿路感染,男性性功能障碍和伴随不确定或未经确认的UC诊断[9-11]的焦虑相关联。最值得注意的是,这种新方法具有减少资源负担和减少与UC阴性患者的全面泌尿病情检查相关的经济成本的潜力。例如,在英国,最初的细胞学和/或肿瘤标志物测试为阴性的血尿患者避免做膀胱镜检查已经被评估为,每名被评估的患者节省约770美元(每名患者483英镑)[13]。当用在初期评估环境时,这里所描述的G+P指数提供了对使用尿细胞学的有效的替代。这在初级评估是由初级保健医生进行的环境中尤为重要。在此基础上,如果我们指定每次全面泌尿病情检查任意的“名义成本”为4,500美元,1000名显微可见血尿患者的病情检查总成本为接近450万美元。相反,如果任意的名义成本为2,500美元、80%的显微可见血尿患者利用G+P指数被归类出来,那么剩余20%患者接受测试和全面泌尿科病情检查的总直接成本为340万美元。这提供了每1000例显微可见血尿患者理论净节省约110万美元的直接成本。虽然由O'Sullivan等人开发的基因型算法[33]由与呈现在这里的G+P指数相同的基因型成分组成,但是敏感性和特异性之间的平衡为了正在经历全面的泌尿科病情检查的有症状患者(即呈现血尿)的最佳初级UC检测而进行校准。相反,本研究中的G+P指数还纳入了表型变量,并且已经被优化为高灵敏度和高NPV,以分离出那些不需要针对疑似UC的全面的泌尿科病情检查的血尿患者。没有试图定义或选择UC患者。取而代之的目的是有把握地排除那些没有UC的患者,因此,所有没分离出来的患者将进行全面的泌尿病情检查。虽然当评估呈现血尿患者的UC风险时,一些研究之前已经寻求开发考虑表型的预测模型,但是单独的依赖表型的模型的准确性好像是有限的。例如,Loo等人[21]前瞻性地调查了表型参数是否可以用来确定可能不需要泌尿外科转诊和全面病情检查的显微可见血尿患者,并且得出结论,年龄、男性和近期诊断为肉眼可见血尿是UC的显著预测指标。吸烟史和在最近的尿检>25RBCs/HPF孤立地不是UC的统计显著预测指标,但是即使当被包括在他们的‘血尿风险指数’中以提高预测的准确性时,该指数得到0.809的AUC[21]。有趣的是,对于吸烟史和性别,,这项研究中的表型的OR和那些由Loo等人识别的表型参数可与重叠的95%CI相比,并且虽然年龄、性别和吸烟史在每个模型中有类似的加权,呈现在这里的G+P指数的基因型组分的影响可能引起更高的AUC[21]。同样,Cha等人[20]报道,年龄、吸烟史和血尿的程度,而不是性别,是与无症状性血尿患者的UC存在显著相关的,并使用了多变量模型来开发由预测UC的表型和尿细胞学检查数据组成的列线图。如同Loo等人[21]的研究,所报道的表型OR与这里报道的那些表型OR是可比的,但是即使在将尿细胞学列入到列线图之后,在[20]中报道的0.831的AUC低于G+P指数的AUC。在另一项研究中,Tan等人[22]使用由患者的年龄,性别,吸烟史和血尿程度得到的列线图,回顾性地分层被转诊到专门的泌尿外科诊所的血尿患者到高风险组和低风险组。虽然由于缺乏数据(405例患者中的80例)大部分的患者被排除,与本研究的比较必须谨慎,0.804的AUC,0.900的敏感性和0.953的NPV均低于这里描述的G+P指数。也已经进行了多种尝试通过用尿生物标志物测试的结果补充它们来改善表型模型的精确度。当护理蛋白质组学测定的核基质蛋白NMP22点被孤立地用于检测UC,它具有0.557的灵敏度和0.968的NPV[17]。Lotan等人[41]发表了多变量算法,包括表型因素,NMP22和尿细胞学和用0.802[31]的AUC进行前瞻性验证的预测UC的0.826的AUC。但是,要注意的是,这个模型试图在有和没有UC的高风险患者之间作区分,而不是最大化敏感性和NPV以归类出UC低概率的患者。特别是,用包含基因型和表型数据的算法得到的改进的精度以前已经在乳腺癌中证明了[42-45]。同样,Mitra等人[30]使用分子标志物和吸烟强度的组合来计算多变量模型,其优于在预测UC患者幸存的常规临床病理参数。然而,本研究首次证明表型风险因素可以与基因型数据相结合,以增加模型的准确性,该模型分离血尿患者到需要不同水平的泌尿外科跟进和临床护理的类别,而不是预测幸存的。当表型数据与模型中的基因型数据相结合,数据的解析可能影响模型的准确度。例如,吸烟是很好理解的UC风险因素,并且包括在用于检测UC的大多数表型模型中。在Cha等人[20],Tan等人[22],Lotan等人[31,41]和当前的研究中,使用二进制判别式从不吸烟者和当前/以前吸烟者,而Mitra等人[30]基于吸烟年限和每天吸烟数量计算吸烟强度,Loo等人[21]分类吸烟者为从不吸烟,被动吸烟者,已戒烟的吸烟者和当前吸烟者。虽然已知的是暴露于吸烟显著增加UC风险[46],随意地定义的表型变量可以限制表型模型的总体精度和效用。与此相反,患者的基因型和表型变量之间的相互作用就不会无法预期。然而,结合表型因素和遗传变量的影响到单个工具中改进了这项研究中所描述的模型的准确度。类似的原则也适用于描述血尿表型。呈现显微可见血尿或肉眼可见血尿的患者基本上是在生物连续体上,并且有患有UC[2-6,21]的不同可能性。因此,尽管本研究中的所有显微可见血尿患者具有0的Hfreq得分,他们血尿的严重程度,与其他表型因素组合,可能是间接地体现在G+P指数的基因型成分中。参考文献紧接下面列举的文章参考示例4,并且通过充分引用全部并入本说明书中。1.KellyJD,FawcettDP,GoldbergLC:Assessmentandmanagementofnon-visiblehaematuriainprimarycare.BMJ2009,338:a3021.2.DavisR,JonesJS,BarocasDA,CastleEP,LangEK,LeveilleeRJ,MessingEM,MillerSD,PetersonAC,TurkTMT,WeitzelW:Diagnosis,evaluationandfollow-upofasymptomaticmicrohematuria(AMH)inadults:AUAguideline.JUrol2012,188(6Suppl):2473-2481.3.SuttonJM,Evaluationofhematuriainadults.JAMA1990,263:2475-2480.4.KhadraMH,PickardRS,CharltonM,PowellPH,NealDE:Aprospectiveanalysisof1,930patientswithhematuriatoevaluateclinicalpractice.JUrol2000,163:524-527.5.DavidsonP:Re-designofahaematuriaclinic:Assessmentof2346haematuriapatients.JUrol2011,185(4S):e495.6.PriceSJ,ShephardEA,StapleySA,BarracloughK,HamiltonWT:Non-visibleversusvisiblehaematuriaandbladdercancerrisk:Astudyofelectronicrecordsinprimarycare.BrJGenPract2014,64:e584-e589.7.ButeauA,SeidemanCA,SvatekRS,YoussefRF,ChakrabatiG,ReedG,BhatD,LotanY:Whatisevaluationofhematuriabyprimarycarephysicians?Useofelectronicmedicalrecordstoassesspracticepatternswithintermediatefollow-up.UrolOncol2014,32:128-134.8.JimboM:Evaluationandmanagementofhematuria.PrimCare2010,373:461-472.9.HerrHW:Theriskofurinarytractinfectionafterflexiblecystoscopyinbladdertumorpatientswhodidnotreceiveprophylacticantibiotics.JUrol2014Jul18.pii:S00225347(14)03963-9.10.BurkeDM,ShackleyDC,O'ReillyPH:Thecommunity-basedmorbidityofflexiblecystoscopy.BJUInt2002,89:347-349.11.StavK,LeiboviciD,GorenE,LivshitzA,SiegelYI,LindnerA,ZismanA:Adverseeffectsofcystoscopyanditsimpactonpatients'qualityoflifeandsexualperformance.IsrMedAssocJ2004,6:474-478.12.RaoPK,JonesJS:Howtoevaluate'dipstickhematuria':Whattodobeforeyourefer.CleveClinJMed2008,75:227-233.13.RodgersM,NixonJ,HempelS,AhoT,KellyJ,NealD,DuffyS,RitchieG,KleijnenJ,WestwoodM:Diagnostictestsandalgorithmsusedintheinvestigationofhaematuria:systematicreviewsandeconomicevaluation.HealthTechnolAssess2006,10:iii-iv,xi-259.14.FalebitaOA,LeeG,SweeneyP:Urinecytologyintheevaluationofurologicalmalignancyrevisited:isitstillnecessary?UrolInt2010,84:45-49.15.FeiferAH,SteinbergJ,TanguayS,AprikianAG,BrimoF,KassoufW:Utilityofurinecytologyintheworkupofasymptomaticmicroscopichematuriainlow-riskpatients.Urology2010,75:1278-1282.16.SvatekRS,HollenbeckBK,S,LeeR,KimS,StenzlA,LotanY.Theeconomicsofbladdercancer:Costsandconsiderationsofcaringforthisdisease.EurUrol2014,66:253-262.17.GrossmanHB,MessingE,SolowayM,TomeraK,KatzG,BergerY,ShenY:Detectionofbladdercancerusingapoint-of-careproteomicassay.JAMA2005,293:810-816.18.FriedlanderDF,ResnickMJ,YouC,BassettJ,YarlagaddaV,PensonDF,BarocasDA:Variationintheintensityofhematuriaevaluation:atargetforprimarycarequalityimprovement.AmJMed2014,127:633-640.19.ShinagareAB,SilvermanSG,GershanikEF,ChangSL,KhorasaniR:Evaluatinghematuria:impactofguidelineadherenceonurologiccancerdiagnosis.AmJMed2014,127:625-632.20.ChaEK,TirsarLA,SchwentnerC,HennenlotterJ,ChristosPJ,StenzlA,MianC,MartiniT,PychaA,ShariatSF,Schmitz-BJ:Accurateriskassessmentofpatientswithasymptomatichematuriaforthepresenceofbladdercancer.WorldJUrol2012,30:847-852.21.LooRK,LiebermanSF,SlezakJM,LandaLM,MarianiAJ,NicolaisenG,AsperaAM,JacobsenSJ:Stratifyingriskofurinarytractmalignanttumorsinpatientswithasymptomaticmicroscopichematuria.MayoClinProc2013,88:129-138.22.TanGH,ShahSA,AnnHS,HemdanSN,ShenLC,GalibNAFA,SingamP,KongCHC,HongGE,BahadzorB,ZainuddinZM:Stratifyingpatientswithhaematuriaintohighorlowriskgroupsforbladdercancer:anovelclinicalscoringsystem.AsianPacJCancerPrev2013,14:6327-6330.23.SultanaS,GoodmanC,BryneD,BaxbyK:Microscopichaematuria:urologicalinvestigationusingastandardprotocol.BrJUrol1996,78:691-698.24.SugimuraK,IkemotoS-I,KawashimaH,NishisakaN,KishimotoT:Microscopichematuriaasascreeningmarkerforurinarytractmalignancies.IntJUrol2001,8:1-5.25.ViswanathS,ZelhofB,HoE,SethiaK,MillsR:Isroutineurinecytologyusefulinthehaematuriaclinic?AnnRCollSurgEngl2008,90:153-155.26.SteinerH,BergmeisterM,VerdorferI,GranigT,MikuzG,BartschG,StoehrB,BrunnerA:Earlyresultsofbladder-cancerscreeninginahigh-riskpopulationofheavysmokers.BJUInt2008,102:291-296.27.YeungC,DinhT,LeeJ:Thehealtheconomicsofbladdercancer:Anupdatedreviewofthepublishedliterature.Pharmacoeconomics2014,32:1093-1104.28.HolyoakeA,O'SullivanP,PollockR,BestT,WatanabeJ,KajitaY,MatsuiY,ItoM,NishiyamaH,KerrN,daSilvaTatleyF,CambridgeL,ToroT,OgawaO,GuilfordP:DevelopmentofamultiplexRNAurinetestforthedetectionandstratificationoftransitionalcellcarcinomaofthebladder.ClinCancerRes2008,14:742-749.29.SapreN,AndersonPD,CostelloAJ,HovensCM,CorcoranNM:Gene-basedurinarybiomarkersforbladdercancer:anunfulfilledpromise?UrolOncol2014,32:48.e9-e17.30.MitraAP,CastelaoJE,HawesD,Tsao-WeiDD,JiangX,ShiSR,DatarRH,SkinnerEC,SteinJP,GroshenS,YuMC,RossRK,SkinnerDG,CortessisVK,CoteRJ:Combinationofmolecularalterationsandsmokingintensitypredictsbladdercanceroutcome.Cancer2013,119:756-765.31.LotanY,SvatekRS,KrabbeLM,XylinasE,KlatteT,ShariatSF:Prospectiveexternalvalidationofmodelforbladdercancerdetection.JUrol2014,192:1343-1348.32.AbogunrinF,O'KaneHF,RuddockMW,StevensonM,ReidCN,O'SullivanJM,AndersonNH,O'RourkeD,DugganB,LamontJV,BoydRE,HamiltonP,NambirajanT,WilliamsonKE:Theimpactofbiomarkersinmulti-variatealgorithmsforbladdercancerdiagnosisinpatientswithhematuria.Cancer2012,118:2641-2650.33.O'SullivanP,SharplesK,DalphinM,DavidsonP,GillingP,CambridgeL,HarveyJ,ToroT,GilesN,LuxmananC,FelipeAlvesC,YoonHS,HinderV,MastersJ,Kennedy-SmithA,BeavenT,GuilfordP:Amultigeneurinetestforthedetectionandstratificationofbladdercancerinpatientspresentingwithhematuria.JUrol2012,188:741-747.34.EpsteinJI,AminMB,ReuterVR,MostofiFK:TheWorldHealthOrganization/InternationalSocietyofUrologicalPathologyconsensusclassificationofurothelial(transitionalcell)neoplasmsoftheurinarybladder.BladderConsensusConferenceCommittee.AmJSurgPathol1998,22:1435-1448.35.EfronB,TibshiraniRJ:Anintroductiontothebootstrap.NewYork:ChapmanHill;1993.36.DiCiccioTJ,TibshiraniRJ:Bootstrapconfidenceintervals.StatistSci1996,11:189-228.37.Van'tHoogAH,CobelensF,VassallA,vanKampenS,DormanSE,AllandD,EllnerJ:Optimaltriagetestcharacteristicstoimprovethecost-effectivenessoftheXpertMTB/RIFassayforTBdiagnosis:Adecisionanalysis.PLoSONE2013,8:e82786.38.QuX,HuangX,WuL,HuangG,PingX,YanW:Comparisonofvirtualcystoscopyandultrasonographyforbladdercancerdetection:Ameta-analysis.EurJRadiol2010,80:188-197.39.MowattG,N'DowJ,ValeL,NabiG,BoachieC,CookJA,FraserC,GriffithsTR;AberdeenTechnologyAssessmentReview(TAR)Group:Photodynamicdiagnosisofbladdercancercomparedwithwhitelightcystoscopy:Systematicreviewandmeta-analysis.IntJTechnolAssessHealthCare2011,27:3-10.40.BuickCG,NazirSA,MallettS,TurneyBW,OnwuNN,RobertsIS,CrewJP,CowanNC:Evaluationofdiagnosticstrategiesforbladdercancerusingcomputedtomography(CT)urography,flexiblecystoscopyandvoidedurinecytology:resultsfor778patientsfromahospitalhaematuriaclinic.BJUInt2012,110:84-94.41.LotanY,CapitanioU,ShariatSF,HuttererGC,KarakiewiczPI:Impactofclinicalfactors,includingapoint-of-carenuclearmatrixprotein-22assayandcytology,onbladdercancerdetection.BJUInt2009,103:1368-1374.42.TyrerJ,DuffySW,CuzickJ:Abreastcancerpredictionmodelincorporatingfamilialandpersonalriskfactors.StatMed2004,23:1111-1130.43.DubskyP,BraseJC,JakeszR,RudasM,SingerCF,GreilR,Dietze0,LuisserI,KlugE,SedivyR,BachnerM,MayrD,SchmidtM,GehrmannMC,PetryC,WeberKE,FischK,KronenwettR,GnantM,FilipitsM,onbehalftheAustrianBreastandColorectalCancerStudyGroup(ABCSG):TheEndoPredictscoreprovidesprognosticinformationonlatedistantmetastasesinER+THER2—breastcancerpatients.BrJCancer2013,109:2959-2964.44.BrentnallAR,EvansDG,CuzickJ:DistributionofbreastcancerriskfromSNPsandclassicalriskfactorsinwomenofroutinescreeningageintheUK.BrJCancer2014,110:827-828.45.FilipitsM,NielsenTO,RudasM,GreilR,H,JakeszR,Bago-HorvathZ,DietzeO,RegitnigP,Gruber-RossipalC,Müller-HolznerE,SingerCF,MlineritschB,DubskyP,BauernhoferT,HubalekM,KnauerM,TraplH,FeslC,SchaperC,FerreeS,LiuS,CowensJW,GnantM,AustrianBreastandColorectalCancerStudyGroup:ThePAM50risk-of-recurrencescorepredictsriskforlatedistantrecurrenceafterendocrinetherapyinpostmenopausalwomenwithendocrine-responsiveearlybreastcancer.ClinCancerRes2014,20:1298-1305.46.KrabbeLM,SvatekRS,ShariatSF,MessingE,LotanY:BladderCancerRisk:UseofthePLCOandNLSTtoIdentifyasSuitableScreeningCohort.UrolOncol.20149July16):pii:S1078-1439(14)00215-4.结论总之,这里报告的G+P指数表明了改变临床实用的重大机会。G+P指数能够准确地归类出患者,其呈现血尿给他们的临床医生或医师,并具有高整体测试阴性率、高水平灵敏度和高NPV的UC概率很低。这个模型适合于在血尿患者的初期评估过程中使用以归类出不需要全面的泌尿科病情检查的患者,从而潜在地减少了为了针对UC的专业泌尿外科评估而需要转诊的血尿患者的数量,并有助于保持患者的QoL以及减少诊断相关的费用。示例5:使用G+P指数III归类血尿患者(“G2”)G+P指数进一步用于根据UC风险对患者进行分类。然后风险类别用于为患者划分优先次序用于继续调查。本示例提供了用于使用指数归类(triaging)患者的替代性方法,在本说明书中称为“G2+P指数”。它与上述示例4描述的G+P指数相似。G2的定义这个分类器计算下面的公式:M1=[IGF]–[HOXA]+[MDK]+[CDC];然后,R=-6.9802+0.2007*M1+1.7893*[IL8R]+0.1552*M12-0.2882*[IL8R]2-0.0720*M1*[IL8R]获得的得分:SCORE=eR/(1+eR),其中[IGF],[HOXA],[MDK],[CDC]和[IL8R]分别是基因IGF,HOXA,MDK,CDC和IL8R的样本浓度的对数;“*”是普通的乘法,e=2.718282...是自然(Napierian)对数的底数。高得分表示存在UC的可能性较高。作为示例,我们可以设定0.12的阈值并宣布SCORE>=0.12作为患有UC的可能性高,低于0.12的得分为患有UC的可能性低。示例6:同时使用[G1=P]—指数和G2归类出低概率尿路上皮癌的呈现血尿的患者A.显微可见血尿患者患者数据集·45例患者样本被测定。·5例患者缺乏吸烟状况并从本分析中被排除。·所有患者都完成了全面的泌尿科病情检查,并且都没有尿路上皮癌。·表型变量:性别,年龄,吸烟状况·病人的人口统计示于下表13。表13观察到的测试阴性率:使用测试阴性率40%作为阈值,数据示于下表14。表14测试阴性率40%LR<0.120.12<=LR<0.230.23<=LR归类阴性2831归类阳性422使用测试阴性率50%作为阈值,数据示于下表15。表15测试阴性率50%LR<0.120.12<=LR<0.230.23<=LR归类阴性2833归类阳性420使用测试阴性率60%作为阈值给出了相同的结果/对此归类分类,风险最高组(男,当前或之前吸烟者,年龄>=60)均为阳性。总结和结论1.根据临床指导原则的约定,所有41例患者将通常会接受全面泌尿病情检查。2.所有41例患者确实接受了全面的病情检查并且被确定没有尿路上皮癌。3.在测试阴性率(TNR)为50%,85%的显微可见血尿患者将被筛选出,因此,结果是不用接受全面的泌尿病情检查。4.如果在50%的TNR使用Cxbladder-归类(归类指数-3.33),则85.4%的患者将被归类出来,因此,正确地将不会接受全面的泌尿病情检查。5.如果在40%的TNR使用Cxbladder-归类(归类指数-3.0),则80.5%的患者将被归类出来,因此,结果是正确地将不会接受全面的泌尿病情检查。B.肉眼可见血尿患者患者数据集使用来自临床试验数据和NorthShoreandCURT产品试用的587个样本。这个数据集是由包含年龄,性别,吸烟状况和血尿频率,以及IGF,HOXA,MDK,CDC,IL8R的基因浓度的完整数据构成的子集。我们使用了用于开发下面的Cxbladder-归类模型的相同数据;G+P指数=-8.46+0.79IGF-1.60HOXA+2.10MDK+0.95CDC-0.38IL8R+0.98SNS+0.56Hfreq+1.11Gender+0.64Age我们在图24中绘制了针对G2诊断得分的归类得分。归类阈值-3.33,-2.99和-2.71分别对应于测试阴性率40%,50%和60%。垂直线是0.12和0.23的Cxbladder阈值。实心圆对应肿瘤;绿色是Ta,红色是所有其他更高阶段的肿瘤。表16示出了临床研究结果。表16阶段无癌症T1T2T2aT3TaTis数目515161012403我们考虑了图24的4个象限的计数并且通过各个临界值确定归类指数和G2。-3的Cxbladder-归类(归类指数)的阈值对应于50%的测试阴性率。表17示出了这些结果。表17使用-3.33的Cxbladder-归类阈值(40%的试验阴性率)和相同的0.12的G2阈值,我们观察到的数据示于表18。表18总结和结论1.在相同的时间间隔对相同患者使用Cxbladder归类(G+P)和Cxbladder检测(G2)的系列组合把患者全面分离到四个主要临床分组中。2.对于呈现显微可见血尿和肉眼可见血尿的患者的组合群体,并使用40%的试验阴性率,587例患者中的235例(40.0%)被归类出来。发明人的结论是这些患者将不需要检测UC的全面的病情检查。3.对于同一群体,相应的剩余组352(60%)例患者将接受全面的泌尿科病情检查。4.这个剩余组包含了所有的高级和晚期肿瘤。这些患者没有被归类出来,因此结果是将正确地接受全面的泌尿科病情检查。5.共有4例低级Ta’s(肿瘤总数的5.6%)将被归类出来,并且不会接受全面的病情检查。6.如果归类规则允许归类出所有低于40%的测试阴性率并且G2得分<0.12的患者,则共有13例低级Ta’s被归类出来,其将不会接受全面的病情检查,并且所有高级晚期肿瘤会被找出并接受全面的泌尿科病情检查。7.这些修改的归类规则也导致在所有587例患者中共有440例患者被归类出来(75%)。优势和总体结论结论是,这里报告的G+P指数表明了改变临床实用的显著机会。G+P指数能够准确地归类出患者,其呈现血尿给他们的临床医生或医师,其具有高整体测试阴性率、高水平灵敏度和高NPV的UC低概率。这个模型适合于由初级护理医生用于归类不需要全面的泌尿科病情检查的患者,从而减少了需要转诊以接受专业泌尿外科UC评估的血尿患者的数量,并有助于保持患者的生活质量以及减少了诊断相关的费用。本公开的方法提供了对那些血尿患者的继续调查缺乏需求的出人意料地准确的评估。这些代表不使用本说明书中公开的方法已经不能取得出色的效果。通过引用并入所有专利、专利申请和非专利文献引文全部通过引用并入本说明书中,如同分别以如此方式并入。行业实用性本发明的实施例是在医疗保健和医药领域是有用的。
技术领域:
:本发明的实施例提供了高度准确、灵敏和特异性的计算机实现的方法,用于归类(triaging)患者,以确定哪些患者不需要真正的短期程序或后续处理。该方法基于来自血尿患者的特定遗传和表型信息分析通过提供新的和非显而易见的计算机操作来改进计算机操作,其产生真实的,有用的和具体的成果,以提高医疗质量和降低成本。当前第1页1 2 3 当前第1页1 2 3