SlideShare uma empresa Scribd logo
1 de 10
13.10.31

Excel による遺伝子名の誤変換 - 傾向と
対策 尾崎遼

東京大学

@yuifu

 露崎弘毅

東京理科大学

@antiplastics

http://github.com/kokitsuyuzaki/BioHack-JSBi2013
1

 横山貴央

東京大学

@wakuteka
共同研究者は Excel がお好き

Excel

Excel じゃな
い

2
Excel で遺伝子名が日付に変換される問
題
Excel で遺伝子名が日付に変換される問
題
Excel で遺伝子名が日付に変換される

• デフォルトではセルの書式が「標準」設定
• → 日付っぽいと日付になってしまう
• 例 : Oct4 → 4-Oct ( October 4 と認識)
傾向の調査
NCBI Gene
傾向の調査
単射でない場合がある
• 同じ生物種の異なる Gene symbol が同じ日付に変換される
• Marc1, MARCH1 → 1-Mar
• → 元がどれだか分からない!

MARC2, MARCH2 → 2-Mar

の2種類

意外にも SEP* と SEPT* は相互排他的だっ
た
対策
1. Excel の設定を変える → 負けた気がする
2. ルールベースで戻す → (全)単射でないと無理
3. Identifier を省かない → 修復可能(だけど解決ではない)
4. Excel ファイルを他の言語でつくる

1. 例 : R で Excel ファイルをつくってしまう → 色んな書式設定できて便
利

library(xlsx)
df <- data.frame(gene_symbol=c("OCT4", "SOX2", "KLF4", "C-MYC"),
expression=c(1,6,9,4))
wb <- createWorkbook(type=“xlsx")
sheet <- createSheet(wb, sheet=“sheet1")
cs1 <- CellStyle(wb) + DataFormat("@")
addDataFrame(df, sheet, startColumn=1, row.names=F, colStyle=list(`1`=cs1))
saveWorkbook(wb, file="test.xlsx")
http://qiita.com/yuifu/items/aaff8c6bc8955124c6e0
まとめ
1.    あ
2.    あ
• Identifier を省かない → 修復可能(だけど解決ではない)
• Excel ファイルを他の言語でつくる

•

あ

Mais conteúdo relacionado

Destaque

FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)Haruka Ozaki
 
巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table について巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table についてHaruka Ozaki
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明Haruka Ozaki
 
基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料at grandpa
 
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理Ken'ichi Matsui
 
統計学の基礎の基礎
統計学の基礎の基礎統計学の基礎の基礎
統計学の基礎の基礎Ken'ichi Matsui
 
猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoderSho Tatsuno
 

Destaque (7)

FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table について巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table について
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料
 
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
 
統計学の基礎の基礎
統計学の基礎の基礎統計学の基礎の基礎
統計学の基礎の基礎
 
猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder猫でも分かるVariational AutoEncoder
猫でも分かるVariational AutoEncoder
 

Excelによる遺伝子名の誤変換 -傾向と対策-