第 03 章 实验性高通量癌症研究技术
目录
目录
前言
3.1 微阵列(Microarrays)
3.1.1 微阵列设计的基本原理
3.1.2 基于微阵列实验的 DNA 拷贝数研究
3.1.3 基于微阵列实验的 LOH 研究
3.1.4 基于微阵列实验的 RNA 研究
3.1.5 DNA-蛋白质相互作用研究
3.1.6 DNA 甲基化
3.2 新兴测序技术
3.2.1 高通量测序的基本原理
3.2.2 基于扩增的高通量测序原理
3.2.3 单分子测序的原理
3.2.4 定向测序
3.2.5 高通量测序在肿瘤学中的应用
3.2.6 向单细胞测序发展
3.3 染色体构象捕获
3.4 大规模蛋白质组学
3.4.1 基于微阵列的蛋白质组学
3.4.2 质谱蛋白质组学
3.4.3 蛋白质-蛋白质相互作用
3.5 细胞表型分析
3.6 结论
练习
要点
前言
DNA,包括:
DNA 序列的突变 DNA 拷贝数的改变 等位基因杂合性丢失(LOH) 易位(Translocations) 非编码 RNA 表达,包括 microRNA(miRNA)。 信使 RNA(mRNA)表达,包括:
可变剪接的修饰 蛋白质,尤其是:
它们的数量 它们的修饰,包括蛋白激酶的磷酸化,这在信号传导中起关键作用 表观遗传特征,包括:
DNA 甲基化 组蛋白修饰(甲基化、乙酰化等) 不同分子之间的相互作用,例如:
转录因子与 DNA 的相互作用 蛋白质之间的相互作用 结果是,这些改变导致细胞表型特征的变化。 癌细胞与其环境的相互作用,包括:
血液供应 免疫反应 与细胞外基质(Extracellular Matrix, ECM)的相互作用
图 3.1 肿瘤学中的组学技术。 此图列出了癌症研究中使用的主要组学技术。请注意,还有其他组学方法存在。
3.1 微阵列
3.1.1 微阵列设计的基本原理
图 3.2 Affymetrix GeneChip® 和 Illumina BeadChip 设计。 (A) 芯片由一个 1.28×1.28 平方厘米的改性石英晶片组成。该表面包含约 650 万个 5 微米 × 5 微米 的特征。每个特征由数百万个相同的寡核苷酸(oligonucleotide)探针组成。寡核苷酸为 25 个碱基长的单链序列,作为基因组中已知位点的特定报告者。图片改编自 Dalma-Weiszhausz 等人(2006)。 (B) 硅珠,每个直径为 3 微米,随机自组装到中心间距为 5 微米的微孔中。每个探针在每个阵列上由平均 30-50 个珠子表示。每个珠子包含一个感兴趣的探针序列和一个地址序列,根据 Gunderson 等人(2004)描述的解码系统识别其身份。地址和探针共同代表每个珠子的特定寡核苷酸序列。每个珠子覆盖有数十万个该特定寡核苷酸序列的拷贝。图片改编自 Fan 等人(2006)和 http://www.illumina.com。
3.1.2 基于微阵列实验的 DNA 拷贝数研究
从肿瘤样本(即测试 DNA)和正常样本(即参考 DNA)中分离全基因组 DNA。基因组 DNA 通常使用限制性内切酶消化,且 DNA 片段被差异标记:肿瘤 DNA 使用红色荧光染料(例如 Cy5)标记,而正常 DNA 使用绿色荧光染料(例如 Cy3)标记。 将等量的肿瘤 DNA 和正常 DNA 结合。 混合的肿瘤和正常 DNA 片段在芯片上杂交。在每个斑点内,肿瘤 DNA 目标序列与正常 DNA 目标序列之间进行竞争性杂交。 扫描步骤定量红色和绿色通道的信号强度。生成的图像文件将每个像素分配红色和绿色强度。 图像分析软件准确地重建每个斑点的信号强度。
图 3.3 Array-CGH 协议。 该协议包括 DNA 的提取和标记、在芯片上的杂交、信号的扫描和图像分析以进行量化。(参见彩色插页。)
图 3.4 理论阵列-CGH 定量。 不同 DNA 拷贝数改变在肿瘤 DNA 中的理论比率和 -比率。
图 3.5 IMR32 神经母细胞瘤细胞系的 aCGH 特征图。 显示了从染色体 1 到 22 以及 X 沿基因组排列的每个探针的 -比率。垂直黑线表示染色体之间的分隔。垂直虚线表示着丝粒位置。通过 aCGH 识别出 1p-17q 的不平衡易位和 1q 的增益。得益于 aCGH 技术的高分辨率,可以检测到小规模的改变,例如 MYCN 的扩增。数据来源:Janoueix-Lerosey 等人(2005)。 (参见彩色插页。)
3.1.3 基于微阵列实验的 LOH 研究
盒子 3.2:单核苷酸多态性(SNP)
SNP(Single Nucleotide Polymorphism,发音为 snip)是一种 DNA 序列变异,当基因组中单个核苷酸(A、T、C 或 G)在两个个体之间的同一基因组位置上发生差异时,便形成了 SNP(Sachidanandam et al., 2001;Bunz, 2008)。以下是一个 SNP(C/G)的示例,其中存在两个等位基因(随意命名为 A 和 B):
A 等位基因:gtaccccatccctc c gtgtcgtgaatcaga B 等位基因:gtaccccatccctc t gtgtcgtgaatcaga SNP 平均每 1,000 到 2,000 个核苷酸中出现一次,只有当这种变异在群体中 1% 或以上的个体中出现时,才被称为多态性。在 NCBI 的 dbSNP 数据库中已记录了约 1,000 万种此类变异(Sherry et al., 2001)。大约 96% 的 SNP 出现在非编码区:其中一些可能表现为表型沉默,而另一些则可能具有功能性影响(例如,若某 SNP 位于调控序列、选择性剪接位点等区域)。其他 SNP 被称为非同义 SNP,它们会影响蛋白质序列。这两种类型的 SNP 都可以作为寻找与疾病、药物反应和复杂表型相关基因的标记。
图 3.6 BAF 值的示例父源(father)染色体 F 用白色表示,母源(mother)染色体 M 用黑色表示。正常细胞状态(A)到癌细胞中可能发生的五种不同变异状态(B 到 F)均有展示,并计算每个 SNP 的 BAF 值。
图 3.7 理论 BAF 和 LRR 值对于可能的不同变异情况,展示了理论 BAF 和 LRR 值。F 和 M 分别表示父源和母源染色体。
图 3.8 T47D 乳腺癌细胞系的 LRR 和 BAF 图谱对于从染色体 1 到 22 以及 X 染色体沿基因组排序的每个探针,显示了 LRR 值(顶部图谱)和 BAF 值(底部图谱)。垂直黑线表示染色体之间的分隔,垂直虚线表示着丝粒位置。在 LRR 图谱中,分段黑线对应于每个基因组区域的平均拷贝数;绿色 = 1 拷贝,黄色 = 2 拷贝,红色 = 3 拷贝,蓝色 = 4 拷贝。T47D 细胞系的 Affymetrix Human Mapping 100K Xba 芯片数据已从 NCBI GEO 数据库检索。我们使用 CRMAv2 (Bengtsson et al., 2009) 和 GLAD (Hupé et al., 2004) 分析了 LRR 图谱数据,使用 ACNE (Ortiz-Estevez et al., 2010) 分析了 BAF 图谱数据。可以将这些图谱与图 2.12 中提供的 T47D 乳腺癌细胞系的核型和图 3.15 中通过 NGS 获得的结果进行比较。数据来源:Hu et al. (2009)。(参见彩色插图。)
3.1.4 基于微阵列实验的 RNA 研究
3.1.5 DNA–蛋白质相互作用研究
细胞在所需实验条件下培养。 在细胞培养物中,蛋白质通常使用甲醛与 DNA 交联。此步骤形成 DNA-蛋白质之间的可逆键并将 DNA 关联到 POI。 交联后,细胞被裂解,染色质被切割成 1Kb 或更小的片段。 与目标蛋白(Protein of Interest, POI)交联的 DNA 片段通过使用识别 POI 的抗体进行免疫沉淀而富集。 甲醛交联随后被逆转,DNA 被纯化。 通常需要进行 DNA 扩增步骤,因为免疫沉淀得到的 DNA 量较低。 然后将富集的 DNA 标记为带有荧光分子(如 Cy5)。此过程称为免疫沉淀(ImmunoPrecipitation, IP)部分。 在双色微阵列平台中,在免疫沉淀前保留部分裂解产物,用于提取 DNA,作为对照,并同样被扩增并用不同的荧光染料(如 Cy3)标记。此过程称为输入(input)部分。 IP 和输入分数被结合并按照 aCGH 协议(见图 3.3)的相同方式杂交到单个 DNA 微阵列上。IP 信号和输入信号通过扫描仪在微阵列上进行量化。
图 3.9 ChIP-on-chip 实验流程 从细胞培养物中,目标蛋白(Protein of Interest, POI)和 DNA 之间的相互作用通过免疫沉淀分离。免疫沉淀(ImmunoPrecipitation, IP)部分和输入部分均在微阵列上杂交。图像改编自 Buck 和 Lieb(2004)。
图 3.10 ChIP-on-chip 图谱 沿基因组表示 IP 信号与输入信号之间的 比值。POI 的 DNA 结合区域在基因组图谱中显示为一个峰值。
3.1.6 DNA 甲基化
图 3.11 DNA 甲基化探针设计 在基于亚硫酸氢盐处理的方法中,为每个位点设计了两个不同的探针,以检测其甲基化状态。当探针与甲基化状态的目标位点配对时,未甲基化探针中的所有 G 核苷酸被替换为 A。根据研究位点的甲基化状态,发出或不发出荧光信号。
3.2 新兴的测序技术
BOX 3.3:测序中的关键概念
template(模板):它是测序仪需要读取的真实核苷酸序列。 read(读取):它对应于测序仪读取的模板序列。读取的长度从几十个碱基到上百个碱基不等,取决于所使用的技术。当前技术在一次实验中可产生数百万到数十亿个这样的读取。 sequencing error(测序错误):它是读取中的碱基,与模板中的真实碱基不对应。 depth of coverage(覆盖深度):它表示基因组中某个位置的读取数 ,通常表示为 。覆盖深度可以通过基因组内所有位置的平均覆盖深度来概括。由于测序仪可能产生测序错误,增加覆盖深度可以提高对齐或组装后获得的序列的准确性。 coverage(覆盖率):它表示至少被一个读取覆盖的基因组的百分比。 reference genome(参考基因组):它是样本中每条染色体的核苷酸序列,被认为是一个物种的代表。参考基因组通常通过从头测序(de novo sequencing)获得。人类基因组计划产生了第一个人类参考基因组。 alignment(比对):它是将读取映射到参考基因组上(即获取它们在染色体上的位置)的过程。由于读取中通常存在测序错误,因此允许读取与参考基因组之间存在不完全匹配。 sequence assembly(序列组装):将读取合并成更长的 DNA 片段的过程,以重建所研究样本的序列。 de novo sequencing(从头测序):它是将读取组装在一起形成新的、先前未知的序列的过程。 run(运行):测序仪为了生成读取而执行的一组步骤。 GC-content(GC 含量):它是 DNA 序列中为 G 或 C 的碱基百分比。
3.2.2 基于扩增的高通量测序原理
图 3.12 SOLiD 平台的文库构建 (A) 对于单端测序和双端测序,DNA 被剪切成片段(片段或模板的两端 T1 和 T2 的长度范围为 150 到 180 bp)。单端测序进行一个测序步骤(从位置 ),双端测序进行两个测序步骤(从位置 和 )。 (B) 创建油-水乳液以包封直径为 1 微米的珠子,珠子上带有 P1 和 P2 适配器以及单一模板。乳液 PCR 在微滴内进行后,珠子包含了几千个初始模板序列的拷贝。 (C) 在 mate-pair 文库中,根据所需大小选择 DNA 片段(例如,选择两端 T1 和 T2 的片段大小为 3 Kb)。然后在片段的两端连接一个内部适配器,DNA 被环化并在内部适配器的两侧被切割,使得两个生成的模板长度均为 50 个碱基。进行两个测序步骤。 以上内容改编自寡核苷酸连接与检测测序(SOLiD™)文档。
图 3.13 使用 mate-pair 测序识别基因组重排 在对肿瘤基因组进行 mate-pair 测序(使用 SOLiD™ 测序仪)后,mate-pair 读取被比对到参考基因组上。由于 mate-pair 之间的预期距离是已知的(例如,),可以根据比对到参考基因组上时观察到的 mate-pair 之间距离 的变化来识别缺失或插入。平衡和非平衡易位也可以被识别。工具如 SVMDetect(Zeitouni 等,2010)可以用于识别这些重排。有关易位检测的应用,参见图 3.15。
图 3.14 从第二代到第四代测序,以 TAGGCT 模板为例 (A) 第二代测序。在 Ion Torrent PGM 中,每个碱基被顺序添加并清洗。由于氢离子释放导致的电压变化,指示了已合并了多少个碱基。 (B) 第三代测序。在 PacBio RS 中,四种标记的核苷酸被添加到阵列上方。每种颜色的光强度指示了聚合酶沿着 DNA 序列合并了哪个核苷酸。 (C) 第四代测序。在 GridION 的外切酶测序中,外切酶连接到纳米孔上,从模板上逐个切割碱基。当碱基穿过纳米孔时,它暂时与适配分子结合,引起特征性的电流中断。 (D) 第四代测序。在 GridION 的链测序中,模板由于聚合反应被穿入纳米孔中。只要模板穿过纳米孔,每个碱基会像外切酶测序一样引起特征性的电流中断。 (参见彩色插页)
3.2.3 单分子测序原理
3.2.4 靶向测序
3.2.5 高通量测序在肿瘤学中的应用
定量 mRNA 表达(这称为 RNA-seq) 定量 miRNA 表达 鉴定替代剪接形式 定量 DNA 拷贝数(参见图 3.8,图 3.15) 鉴定 LOH(杂合性缺失) 使用 ChIP-seq 鉴定蛋白质与 DNA 的相互作用,即免疫共沉淀后测序(Farnham, 2009) 映射核小体在 DNA 序列中的位置 研究表观基因组修饰 发现突变 发现多态性 以单碱基分辨率映射染色体重排(易位、融合基因、缺失、扩增等)(Chen 等,2008;Campbell 等,2008)(参见图 3.15) 发现非编码 RNA(ncRNA) 研究染色质的空间组织
图 3.15 使用 mate-pair 测序对 T47D 细胞系中的 DNA 拷贝数和染色体间易位进行鉴定 染色体(黑色 = p 臂,灰色 = 着丝粒,白色 = q 臂)围绕一个圆圈表示。内圈中的黑色连线表示染色体间易位。在此实验中也鉴定了图 2.12 中所示的易位。外圈代表 DNA 拷贝数图谱,其外观与图 3.8 中的图谱非常相似。我们使用以下算法分析数据:读取使用 bowtie 算法比对(Langmead 等,2009),DNA 拷贝数由 FREEC 估计(Boeva 等,2011a),易位由 SVMDetect 鉴定(Zeitouni 等,2010)。使用 Circos 绘制结果(Krzywinski 等,2009)。图 3.13 解释了如何鉴定易位。数据来源于 Hillmer 等(2011)。
3.3 染色体构象捕获
图 3.16 基于 3C 的方法的协议 (A) 3C 量化两个感兴趣位点之间的相互作用,(B) 4C 量化一个感兴趣位点与整个基因组之间的相互作用,(C) 5C 量化位于感兴趣区域内的位点之间的相互作用,(D) Hi-C 量化基因组内所有可能位点之间的相互作用。图像改编自 Simonis 等(2007);Tanizawa 和 Noma(2011)。
图 3.17 基于 3C 方法的示意表示 在 Hi-C 实验中,数据可以表示为一个对称矩阵,其中一行和一列分别对应于两个不同的位点,使得所有行和列覆盖整个基因组。对于矩阵中的一个单元格(即一对位点),可以赋予一个从 0 到 1 的值,表示它们相互作用的频率。3C、4C 和 5C 分别对应于矩阵中的一个单元格、一行和一个子矩阵,而 Hi-C 获得的是整个矩阵。
3.4 大规模蛋白质组学
3.4.1 基于微阵列的蛋白质组学
图 3.18 蛋白质阵列 (A) 在夹心微阵列(sandwich microarray)中,特定的初级抗体固定在载玻片上以捕获目标蛋白(Protein of Interest, POI),随后通过与荧光染料耦联的特定次级抗体进行检测。 (B) 在抗原捕获测定(antigen capture assay)中,POI 同样通过固定抗体捕获,但捕获的蛋白直接检测(在对复杂的蛋白混合物进行化学标记后)。 (C) 在反向相位蛋白阵列(Reverse-Phase Protein Array, RPPA)中,蛋白质混合物本身固定在载玻片上。POI 可以通过与荧光染料耦联的初级抗体识别,或 (D) 通过识别蛋白的初级抗体和靶向初级抗体的与荧光染料耦联的次级抗体识别。AB = 抗体(antibody)。图片改编自 MacBeath(2002)。
夹心免疫测定法(Sandwich immunoassay):该技术基于广泛用于医学诊断的酶联免疫吸附测定(Enzyme-Linked ImmunoSorbent Assay, ELISA)。首先,将特定抗体固定在载玻片上以捕获 POI,随后使用与荧光染料耦联的第二种特定抗体进行检测(见图 3.18A)。此技术要求有两种特异性抗体可用于识别 POI。在单个生物样本中,若抗体与 POI 之间不存在交叉反应,数十种蛋白质可以同时定量。 抗原捕获免疫测定法(Antigen capture immunoassay):样本中的蛋白质首先进行标记程序,添加荧光染料到每个蛋白质上(见图 3.18B)。使用两种不同的荧光染料允许在单次实验中测量两个不同的样本,类似于基因组比较杂交(array Comparative Genomic Hybridisation, aCGH)协议(见图 3.3)。POI 由固定抗体捕获,与前一种技术相同,并测量两种荧光强度。对于单个样本,可以同时定量几百种蛋白质。 反向相位蛋白阵列(Reverse-phase protein array, RPPA):样本中的蛋白质直接固定在载玻片表面。可以使用与荧光染料耦联的特异性初级抗体(见图 3.18C)或同时使用特异性初级抗体和与荧光染料耦联的次级抗体来识别 POI(见图 3.18D)。初级抗体通常来自另一物种(例如研究人类蛋白质组时,使用兔源抗体),而次级抗体能够识别任何兔源抗体。这种策略降低了与初级抗体耦联荧光染料的成本。前两种技术允许在单次实验中测量一种或两种样本中的多种不同蛋白质,而 RPPA 则允许在单次实验中定量数百个样本中的单一 POI。在这种情况下,微阵列上的一个斑点对应一个样本的蛋白质裂解物。
3.4.2 基于质谱的蛋白质组学
Box 3.4:质谱 一个质谱仪由以下装置组成:
离子源:将气相、液相或固相样品分子转化为离子。 质量分析器:通过应用电磁场,根据质量电荷比(m/z)对离子进行排序。不同的技术包括飞行时间(time-of-flight)、离子阱(ion trap)、四极杆(quadrupole)、傅里叶变换质谱(Fourier transform mass spectrometry)和轨道阱(orbitrap)。这些技术各有其特点,适用于不同的应用。 检测器:记录每个 m/z 值的离子数量。 质谱(MS)或串联质谱(MS/MS)实验的输出结果是一个谱图,由一系列在给定 m/z 值下的峰组成。每个峰的高度表示离子的丰度。通常将最高峰的高度重新调整为 100。
图 3.19 质谱协议 蛋白质从细胞或组织中提取,并在一维电泳(one-dimensional electrophoresis, 1DE)后选择子蛋白质组。蛋白质被消化成肽段,通过液相色谱(Liquid Chromatography, LC)分离并电离,获得质谱(Mass Spectrometry, MS)谱图和串联质谱(Mass Spectrometry/Mass Spectrometry, MS/MS)谱图。(见彩图插页)
蛋白质从细胞或组织中提取。由于质谱仪无法同时处理多种蛋白质,提取的是一个子蛋白质组。这通常通过一维或二维凝胶电泳(1D 或 2D gel electrophoresis∗)实现。此外,整蛋白的 MS 灵敏度低于肽段 MS,通常采用蛋白水解反应用胰蛋白酶(或其他酶)对蛋白质进行酶促消化,生成小肽段。每种蛋白质都有其特有的签名,称为肽质量指纹,是在特定 m/z 值下的一系列峰。 为了提高 MS 的灵敏度和特异性,使用液相色谱(Liquid Chromatography, LC)分离样本中的肽混合物。简而言之,分析物在穿过色谱柱时与固定相发生特定的化学或物理相互作用,减缓了其移动速度。减缓程度取决于分析物的性质(如疏水性)和固定相与流动相的成分。特定分析物在特定条件下的洗脱时间(retention time)被视为该分析物的相对独特的识别特征。当分析物从色谱柱中洗脱出来时,通过 ESI 进行电离并由 MS 和 MS/MS 分析。 电离后,离子混合物进入第一个质量分析器,根据它们的 m/z 值进行排序并检测。对在固定时间窗口内进入质量分析器的离子产生一个 MS 谱图,称为扫描谱。 在 MS/MS 中,流程如下:从 MS 谱图中,扫描谱的离子要么是特定选择的(例如用户预先定义的离子列表),要么是自动选择的(例如最高峰的前体离子)。前体离子通常对应于独特的肽段,但在某些情况下可能会被其他肽段污染。接着,前体离子与中性气体碰撞后被分解成产物离子。产物离子根据是否包含氨基端(N-terminus)或羧基端(C-terminus)被命名为 ai、bi、ci 或 xi、yi、zi,其中 i 表示离子中氨基酸的数量(见图 3.20)。为保持稳定性,切割通常发生在肽键处,因此主要观察到 b 和 y 产物离子。最终,第二个质量分析器根据 m/z 值对产物离子进行排序。生成的 MS/MS 谱图允许氨基酸序列的鉴定。 MS/MS 谱图允许通过生物信息学工具(如 MASCOT 或 SEQUEST)在参考数据库中查询以鉴定肽段(Shadforth 等人, 2005)。传统生物学方法和生物信息学预测模型已识别出许多基因序列。结果,人类参考基因组中大约有 25,000 个基因被注释。通过应用遗传密码至 DNA,并在计算机中模拟胰蛋白酶消化,可以推导出可获得的肽段的完整列表。包含每个肽的 m/z 值列表的数据库最终被查询,以检索样本中很可能存在的候选蛋白质。
图 3.21 定量质谱 四种不同的策略允许对肽段进行特定标记,以区分不同的条件。对于每个肽段,在质谱(MS)谱图中可以观察到 m/z 值的位移,适用于 (A) SILAC,(B) ICAT,(D) 酶标记法;或者在串联质谱(MS/MS)谱图中观察到 m/z 值的位移,适用于 (C) iTRAQ。峰高度之间的比率表示不同条件之间的相对差异。
3.4.3 蛋白质-蛋白质相互作用
图 3.22 酵母和哺乳动物双杂交系统的原理 (A) 在酵母双杂交系统(Yeast Two-Hybrid system)中,猎物和诱饵质粒都被转染到酵母中。如果蛋白质 X 和 Y 物理上相互作用,报告基因将被转录。 (B) 在反向酵母双杂交系统中,报告基因的转录对酵母是致命的。在此例中,URA3 基因编码的蛋白质将分子 5-FOA 转化为有毒代谢物。如果 X 和 Y 发生相互作用,酵母细胞在存在 5-FOA 的情况下会死亡(上图);而如果一种药物阻止 X 和 Y 的相互作用,在存在 5-FOA 的情况下可观察到细胞生长。 (C) 在酵母三杂交系统中,如果 X 和 Y 都与第三种已知蛋白 Z 相互作用,则报告基因将被转录。 (D) 在哺乳动物双杂交系统(Mammalian Two-Hybrid system)中,猎物和诱饵质粒与酵母双杂交系统一样被转染到哺乳动物细胞中。此外,还转染了一个包含 UAS 区域的报告质粒,该质粒自然存在于酵母中。TM:转录机器(Transcription Machinery);UAS:上游特异性激活序列(Upstream specific Activation Sequence)。图片及说明改编自 Suter 等人 (2008);Causier (2004);Lievens 等人 (2009);Luo 等人 (1997)。
图 3.23 串联亲和纯化(Tandem Affinity Purification, TAP)的原理。
3.5 细胞表型分析
图 3.24 使用细胞表型分析表征细胞生长速率 细胞核以白色或浅灰色显示。它们被细胞膜包围。图片由 Jacques Camonis 博士提供。版权所有 © 2012 居里研究所(Institut Curie)。
3.6 结论
练习
在 Ewing 肉瘤中,您希望研究嵌合致癌转录因子基因 EWS/FLI1 的可能靶基因(参见第 29 页)。您会为此建议使用哪种高通量技术,并建议哪种实验设计? 假设您已使用寡核苷酸连接与检测(SOLiD™)平台对乳腺癌细胞系 T47D 进行了 mate-pair 测序。如何通过这些测序数据生成图 3.8 中所示的 B 等位基因频率(BAF)图谱?
重点
存在多种高通量技术来研究不同的分子水平。 高通量技术发展非常迅速。 高通量技术能够识别和表征生物系统中分子成分及其相互作用。 微阵列可以用于研究必须预先已知的寡核苷酸序列或蛋白质。 NGS 能够破译基因组的先前未知特征,并在灵敏度方面优于微阵列。 蛋白质研究仍然很复杂,从而限制了高通量的应用。 技术的进步提供了从细胞群体到单细胞行为和组织的缩放研究的可能性。