生物学学生+蟋蟀+高性能电脑=科学突破

发表由丽贝卡Goldfine
在哈德利·霍奇的分子神经生物学课上,学生们不仅在本学期获得了生物信息学的入门知识,他们还将他们新的计算技能应用到一个项目中,该项目将帮助破译神秘的蟋蟀遗传学。
Hadley Horch用蟋蟀“class=
Hadley Horch,生物学教授和神经科学,用板球。

Horch在她的二十四名学生课前设立的任务是创造一个最大和最完整的公共场地蟋蟀的转录组。到4月。

转录组是指所有的转录产物,称为信使rna (mRNAs),存在于组织中。这些信使RNA是DNA中基因的RNA拷贝,是构建蛋白质的蓝图指令。

“我们想要做的雄心勃勃,”霍赫说。“我们建立这个后,我们也有更多的计划。”他们将使用它们共同的信息,以寻找板块背后的可能生物途径,以补偿感官器官的丧失的卓越能力。

大多数霍希的学生对于完成如此重大的工作所需的计算生物学经验有限,甚至没有经验。为了帮助他们尽快跟上进度,霍奇与巴尔港荒岛山生物实验室(MDIBL)的三名生物信息学专家合作。他们每周都会放大,以领导在线实验室(事实上,他们在同一个实验室教四堂课,以便将班级分成六名社交距离较远的参与者)。

在最近的kanbar 107的实验室会议上,六个蒙面的学生,坐在乔尔格拉伯,高级科学家和Mdibl的资深科学家和在那天教学的计算生物学总监下方的大型屏幕投影之下。一步一步,他和他的同事正在通过命令计算机来引导学生,将计算机串联数十亿遗传物质的碎片。

虽然学生将使用自己的笔记本电脑在项目上工作,但生成转录组的实际工作需要比任何一个桌面或笔记本电脑都能提供的更多计算oomph。因此,学生正在学习如何使用他们的个人计算机连接Bowdoin的高性能计算机集群(HPC),由Bowdoin的高性能计算总监DJ Merrill监督。

Merrill表示,他很高兴看到外部研究设施,Bowdoin类和学院的HPC的融合。“这是我们第一次看到三个融合在一起积极教学,“他说。

“我个人真的很感兴趣 分子 生物学;最近的进步 分子 研究方法使可以追求这么多酷炫和有趣的问题。要了解神经科学的现代研究,有必要跟上这些方法的尖端。我对神经系统和精神病疾病感兴趣,如angelman's,Alzheimer和Parkinson的;这些都是 分子 障碍。为了了解如何治疗和治愈它们,我需要获得工作所需的技能 分子 生物学。我正在获得这些技能 分子 神经。“——Anthony Yanez, 22岁

转录组对所有生物的重要性

对于非生物学家,转录组,同时与基因组相关,非常不同。(转录组单词是转录物和基因组的混合)。基因组是生物体DNA和基因的全部地图。转录物是指在从DNA复制并用于开始建立蛋白质的mRNA中编码的信息。并且转录组是在任何给定时间的给定组织中所有可能的mRNA转录物的目录 - 这意味着它可以相当大。

科学家通过测序来自生物的组织样本中的mRNA - 例如胚胎,脑,肝细胞和其他器官。将组织分解并均化,并从样品中纯化RNA。然后将杂志RNA切成短件并测序,从而产生拼图拼图,其数百万件需要恢复在一起。

抄本阅读样本“class=
由学生组装的一部分转录组的屏幕截图。

Horch希望有一个准确的完整的板球转录组,因为它可以帮助展示她在某些实验下的昆虫(或下调“)中打开或中的哪些基因和其中多少个基因使适应。这反过来可以揭示涉及生物过程中涉及的基因,这些过程导致形成蟋蟀腿或眼睛或更适用于她的研究,听觉系统。

板球非常不寻常,因为它可以在受伤后重新组织其听觉系统。这意味着基本上,在其一个耳朵被切断或损坏之后,板球可以通过重新加速断开的一侧来补偿剩余的完整耳朵。“我们正在寻找这种重组的分子基础,”Horch说。

Horch的研究类型通常被描述为基础科学,这意味着基于她的工作,未来可能存在医学或治疗进步,而她的目标纯粹是无法解决知识。她借阅“临床前”一词来描述基础研究,因为她解释说:“你永远不知道什么会在另一个有机体的系统中变得更加有用,或者成为癌症或再生生物学的重要突破的基础。我们是否有可能可以在别的地方推荐蟋蟀的可塑性吗?“

“那是我们想要到达的地方,”抓斗回荡了霍赫。“最终,无论是理解疾病,寻找治疗,了解发展过程 - 我们想要做的事情是在玩家所在的分子水平以及它们如何变化的分子水平上得到一张照片。”

MDIBL.“class=
荒岛山生物实验室在过去几年里邀请鲍登学院的学生在春假期间到其设施进行教员领导的研究项目。今年,这是不可能的。

与MDIBL的合作关系

自2000年代初以来,MDIBL和Bowdoin已成为联邦资助网络的教育和研究机构建立的一部分缅因州生物医学研究与培训。2019年,本集团 - 生物医学研究卓越的思想网络(inbre) -有一个提高当国家卫生研究院授予1800万美元的时间,继续在未来五年内继续在该州创建研究和培训机会。

Horch自2003年以来,Horch将她的学生带到MDIBL的酒吧港澳实验室 - 总是在春假休息。她的学生通常在海滨实验室里花十个长时间,通常在与她的板球研究相关的项目上。今年,由于Covid,这些时间已经在学期的过程中展开,并在校园里远程举行。幸运的是,BionInformatics - 因为它是计算机基于在线教室的应用。

在一个典型的一年里,Mdibl为遗传学和分子生物学中的学生提供许多基于实验室的培训。在过去的两年里,它还为其缅因州,科学家和教育工作者提供了转录组分析研讨会。

“我们让许多不同的人来研究这个共同的问题”,试图在不同的动物身上制造转录组。格雷伯说:“测序已经变得非常便宜和容易获得,但我们有研究鲈鱼、蠼蚣、龙虾或蟋蟀的人,所以这个研讨会是为了让人们一起工作、一起交谈、共享资源和努力而发展起来的。”

他教导的生物信息学技巧只会在生物学中变得更加重要,当然,还有许多其他领域。“我们的世界是数据密集的,它只是为了获得更多的方式,因此开发技能和心态处理大数据集是一个关键技能,”他说。

“我最近谈到了一些神经科学博士生和研究人员,我问的问题是'你希望你有什么技能你希望你有什么事吗?”他们很多人都说获得了计算机编码的熟练程度,特别是作为技术的进步,你必须坚持技术。“- Lucy O'Sullivan'23

Bowdoin高性能计算

HPCS.“class=

这些图像显示了容纳的高性能计算(HPC)机架首要在前海军基地。计算机连接到Bowdoin的中央校园,具有专用的光纤线路。

生物信息学是一个快速移动的场。“一直有更多的信息,”Horch说。去年夏天,蟋蟀基因组是公开可用的 - 一个主要的里程碑。目前还存在五个转录om(来自Horch的实验室的两个)。“但它们都是零碎的,”Horch说,“并由不同的群体分开制作。”

Horch希望她的学生接受这些转录om,这些“数据盆”,并将它们建立在一个统一的转录组中,这将为Cricket Reginal Compule Community的每个人提供“更完整和完整的资源”。

但是要做到这一点,她的课程需要一个高通量的计算机以逻辑的方式将大量的信息组合在一起。“这就是生物信息学知识MDIBL有用的地方,帮助我们思考将这些长序列划分为咬合大小的块,这将导致整个悬挂在一起的东西。我们无法肯定地完成它,“霍赫说。

DJ Merrill.“class=
DJ Merrill监督Bowdoin的高性能计算集群。

而这就是Bowdoin的HPC进来的地方。“学生们会告诉它跑这些巨大的工作,做一些困难和计算的复杂,耗时和资源消耗,他们可以通过他们的命令行来完成它笔记本电脑,“Horch说。

Bowdoin于多年前开始投资其HPC,最初是支持化学,生物学和物理部门的教师研究。从那时起,在附近的前海军基地居住在设施中的计算机的能力随着需求而增长,技术改善了。“我们在加工能力和记忆中跳得了很大的跳跃,”Merrill说。

就在鲍登的科学家们更加依赖高性能计算的同时,硬科学以外领域的教员——如数字与计算研究、环境研究、经济学和政府——也更加频繁地利用鲍登的计算能力。

就在过去的三四年里,越来越多的学生也开始使用高性能计算进行独立研究和课堂项目。为了帮助学生连接到HPC, Merrill建立了一个更直观的网络界面,Bowdoin也开始支持jupter,这是一个免费的、开源的网络工具,它有一个图形界面,可以促进HPC程序。

“学生可以用他们的笔记本电脑进入jupythub,运行r,python或任何想要使用的环境,他们的项目将在后端运行HPC,”Merrill说。“这已经开辟了很多机会,我们使用jupyterhub web界面和运行HPC作业来拥有多个类。

在梅里尔和MDIBL的支持下,霍奇的学生们将在几周内完成他们的板球转录组。然后他们将进入第二阶段,即注释和管理资源。与此同时,他们将在“湿实验室”工作,在那里他们将试图确定哪些基因被表达——以及有多少基因被表达——当蟋蟀的听觉器官完好无损时,在对照动物中,以及当它受伤时。

“雄心勃勃,雄心勃勃,才能完成这个故事,”Horch说。“他们会选择一个基因,专注于,剖析组织,并在那种基因上进行测量,以了解它是否在我们预测时上调。这两条股线将很好地聚集在一起 - 生物信息学和湿实验室研究 -因此,学生可以了解您如何构建此资源以及您如何通过实验播放。“