我大概看了一下這篇 paper ,然後做一小段重點(其實是順便拿來交報告ㄉ)

這是一篇 2021/03/12 發表於 Nature 的 paper ,連結 https://www.nature.com/articles/s41586-021-03451-0

Target

這篇 paper 是 International Genome 10K (G10K) consortium 底下的一個 Vertebrate Genomes Project (VGP) 的一項 project

主旨在建立一個完整的 error-free 的 reference genome (因為目前只有 microbial species 做得很好)

目標是組出來的序列至少有以下特性(其實就是要幾乎完美的 genome)

  • Error-free
  • Gaples …


Logo of Galaxy https://galaxyproject.github.io/static/galaxyproject.png

What is Galaxy

Galaxy is an open, web-based platform for accessible, reproducible, and transparent computational research.

Galaxy 是一個開源的、網頁操作的計算平台

Github:

Wiki:

https://en.wikipedia.org/wiki/Galaxy_(computational_biology)

當然,可以用公開的伺服器,他們都有免費額度可以用 https://galaxyproject.org/use/

Architecture 架構圖

故事是這樣的,我們今天想要在我們學校裡架一個 Galaxy ,除了讓合作變得更方便外,也讓我們的主機群資源可以被更多人使用,雖然目前只服務校內。對象尤其是其他 LAB 對於 com …


故事很簡單

就是綠界目前的界面對實況主而言沒這麼好用就是了

所以某一天改進之後,這個服務就派不上用場了

對於直播主不是友善的界面

Architecture 架構圖


各位 DD 們肯定知道多開程式 HoloTools ,那我們要怎麼改裝他,變成台V的多開程式呢

3/14 白色情人節 21:55 截圖 (使用 HoloTools 介面)

HoloTools 介紹

這是俗稱的 HoloTools 程式,由 dragonjet 開發

中文的使用說明(非官方,但是吹雪翻譯大大是重要的貢獻者)

https://fubukitranslate.tw/2020/holotools-introduce/

解決不能同時撥放的方法(這部分是刻意的,這是 Youbute 政策)

https://www.reddit.com/r/Hololive/comments/ixz1f4/how_do_i_get_holotools_to_play_multiple_streams/

或者是用同個作者開發的 extension: tubegrid

困難

他事實上是一個前端介面,而他會 call API 獲取 …


這是一個當生機系資料結構演算法助教的故事,其中一個環節就是用 Judge 自動批改作業。

這堂課會用 Java 來實作演算法,然後這學期開放使用 Python 。

雖然已經有許多 judge 了,但是都是使用文字讀入,文字輸出來比對。而

我們想要直接執行 function,這樣同學比較能專注在演算法上,就像 FaaS (Function as a Service) 一樣

我們使用 autolab 這個介面,再加上執行 code 的系統 Tango(也是 autolab 開發的) 。選擇他單純是因為他的 Documentation 很好,而且 Judge 足夠彈性。

Pipeline 是 autolab 收到 submission,然後丟在 radis queue 裡面,等待交給 Tango 。 Tan …


既然 vtuber 很紅,那我們就來架個 台灣Vtuber 的網站吧

Review

本文根據這個網站 https://holo.poi.cat 來做修改與介紹

老實說,前天這則故事是為了這個網站做的小 example ,介紹了 CDN 跟一些常識類的東西 (不知道 CDN 的務必先看)

Architecture

傳統的 server 長這樣,一個負責所有的事情,

然後上次講的 CDN ,就是把 HTML CSS 等等沒有 state 的資源 交給他們處理,剩下的 API 我們在處理就好了。我們把 /api/v4 的網址導向我們 server 的 IP 就好了。


故事是這樣的,我原本有個用 Vue 寫的靜態網站架在學校的某個個人網頁上,但是一畢業就會消失了(所以這個網站不見很久了),最近突然想把他撿回來,不然很可惜。

於是就直接上雲吧。

Serverless

這裡先提一個有趣的技術叫 server-less,就是你不用花心思 買 server, 管 server, 或者是 維持你的 nginx 的 container 一直在運作,CDN 商會幫你解決。

CDN 是 content delivery network,就是把你的網頁 resource 丟到全世界各地的 server,

第一個優點是 loading 速度會變快(server 跟你的距離變短)

第二個優點是即使其中一個 server 死亡,別人還是可以存取

Copied from https://www.cloudflare.com/zh-tw/learning/cdn/what-is-a-cdn/

當然像 database, ftp 之類的有順序性,有 state …


這篇我想要試圖把 Deseq2 會用到的想法跟統計方式寫下來 避免忘記

其實在 deep learning 時代 我連統計都快忘光了,趕緊複習…

而且蠻複雜的,拖了很久…

如果不想看太過理論的話,這個 workshop 其實很不錯 https://hbctraining.github.io/DGE_workshop/schedule/1.5-day.html

Intro

接續前一篇的 Quantification,我們有了每個基因的 RNA 的 read count (數量) 或者說 表現量 (abundance) 之後

我們想做的事情是看看不同實驗之間有哪些基因有表現量差異。e.g. 比如說同一個人吃藥前,吃藥後,藉由看表現量差異,我們可以期待看到某些gene 機制被抑制了。

釐清問題

t-test

既然有兩群 samples A, …


最近在讀 read-mapping 的 paper 順便寫寫

這篇再補充我之前寫的 Read-mapping 的部分,還有下篇的 graph-genome 做準備

Seed Searching and Extension

先介紹一下術語,通常 read-mapping 會包含兩個階段,Seed searching跟 extension。如下圖,

  • seed searching: 先找到一個 (接近)perfectly match 的一段短序列
  • extension: 然後再從那個區段我們再把它往左右延伸

你會問說為什麼要兩段式,既然 seeding 跟 extension 都有 alignment 的效果,而且 extension 似乎有容錯更高,那直接用 Extension 的方式把所有 reads 貼上去不是很好嗎?

沒錯,就只是速度有差而已,所以我們才會這 …


本篇介紹兩種 Graph-genome 的技術

Introduction

原本的 reference 是 linear genome(e.g GRCh38)。而 graph-genome 就是做成 graph 的樣子(見下圖)

最大的優點就是 可以把所有已知的 variants 全部塞進 reference 裡,當然,什麼都不加的話,就是在 linear reference 上操作,所以保底就是不會輸一般的方式。

我們在此就介紹 2019 的這兩篇有關 graph-genome 的 paper:

  • Hisat2(Kim et al., 2019)
  • Graph Genome Pipeline(Rakocevic et al., 2019) (我在這簡稱GGP好了)

linnil1

目前做生物資訊與演算法,過去做過 Machine Vision(Deep learning),維護伺服器(k8s, docker),部分IOT(rpi, arduino)

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store