'공부해 봅시다/R-Project'에 해당되는 글 9건
- 2009/10/11 McNemar Test
- 2009/10/06 Odds ratio
- 2009/10/04 평균치 비교
- 2009/10/01 Excel 불러오기
- 2009/06/23 함수 지정하기..ㅡㅡ
- 2009/06/21 Heatmap (4)
- 2008/11/26 역시 공부 (2)
- 2008/07/27 Boxplots
- 2008/07/26 Boxplot
Data가 없이 표로만 자료가 주어지는 상황이라면 다음과 같은 방법으로 구할 수가 있다. Data 입력 순서와 보여지는 방식을 잘 보면 응용하기는 쉽다.
> drug <- matrix(c(55,9,43,77), nrow=2, dimnames=list("Before program"=c("No", "Yes"), "After program"=c("No", "Yes")));drug
After program
Before program No Yes
No 55 43
Yes 9 77
> mcnemar.test(drug)
McNemar's Chi-squared test with continuity correction
data: drug
McNemar's chi-squared = 20.9423, df = 1, p-value = 4.733e-06
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| McNemar Test (0) | 2009/10/11 |
|---|---|
| Odds ratio (0) | 2009/10/06 |
| 평균치 비교 (0) | 2009/10/04 |
| Excel 불러오기 (0) | 2009/10/01 |
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
Odds ratio를 R을 사용하여 구하기 위해서 정말 노력해 보았다. 고민하다가 Appleforum 게시판에서 R을 사용한다는 분을 찾아서 문의 메일을 보냈고 그 답장이 왔다. 그대로 해보니 그 동안 구글링한 내가 바보 같이 느껴질 정도로 쉽게 구해졌다. OTL
우선 Package 중에서 epitools를 설치한다. 그 후에
library(epitools)
oddsratio(htn.rawdata[,9], htn.rawdata[,1], conf.level=0.95) 이렇게 구하면 된다. 하지만.. 일반적으로 책에서는 좌측 상단에 우리의 목표값(??)이 위치하게 되는데 도움말을 참고해보면 우리의 함수님께서는 우측 하단에 목표값(??)이 위치해야 하므로 columns을 바꾸어 주어야 한다.
> library(epitools)
> oddsratio(htn.rawdata[,9], htn.rawdata[,1], conf.level=0.95, rev="columns")
$data
Outcome
Predictor 2 1 Total
0 601 819 1420
1 55 114 169
Total 656 933 1589
$measure
odds ratio with 95% C.I.
Predictor estimate lower upper
0 1.000000 NA NA
1 1.518482 1.087011 2.144556
$p.value
two-sided
Predictor midp.exact fisher.exact chi.square
0 NA NA NA
1 0.01401735 0.01637873 0.01464472
$correction
[1] FALSE
attr(,"method")
[1] "median-unbiased estimate & mid-p exact CI"
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| McNemar Test (0) | 2009/10/11 |
|---|---|
| Odds ratio (0) | 2009/10/06 |
| 평균치 비교 (0) | 2009/10/04 |
| Excel 불러오기 (0) | 2009/10/01 |
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
기본적으로 함수는 t.test 이다. 간단하다. 그래서 어렵다. 아파트나 자동차와 마찬가지로 옵션을 넣어주어야 한다.
사용하는 기본 옵션은 다음과 같다.
var.equal = T(RUE) or F(ALSE); 두 집단이 등분산이면 TRUE를 아니면 FALSE를 선택한다.
conf.level = 0.95 ; 입력을 안하면 기본적으로 0.95이다.
예시)
t.test(subset(gumjin.raw, sex=="1")[,3], subset(gumjin.raw, sex=="2")[,3],
paired=FALSE, var.equal=TRUE, conf.level=0.95)
설명)
기본적으로 사용한 Data는 gumjin.raw 라는 항목으로 저장되어 있다.
subset(gumjin.raw, sex=="1")[,3] : gumjin.raw 항목에서 sex 항목에 "1"이라고 선택되어진 자료들에서 3번째 열에 해당하는 자료를 불러오는 것을 말한다.
결과)
Two Sample t-test
data: subset(gumjin.raw, sex == "1")[, 3] and subset(gumjin.raw, sex == "2")[, 3]
t = -1.2357, df = 188, p-value = 0.2181
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-15.897745 3.651791
sample estimates:
mean of x mean of y
180.5364 186.6593
이렇게 결과가 나온다. :)
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| McNemar Test (0) | 2009/10/11 |
|---|---|
| Odds ratio (0) | 2009/10/06 |
| 평균치 비교 (0) | 2009/10/04 |
| Excel 불러오기 (0) | 2009/10/01 |
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
엑셀 파일인 XLS 파일을 R에서 불러오는 방법을 역시나 인터넷에서 찾았다. CSV 등으로 변환해서 불러와도 되지만 그 방법보다 좋은 점은 특정 Sheet를 지정해수 불러올 수 있다는 점이다.
library(RODBC)
xls = odbcConnectExcel("파일명.xls")
Data 명 = sqlFetch(xls, "엑셀 Sheet 명")
이게 홈페이지에 있던 방법이고, 이를 응용해서 한 줄을 줄일 수도 있다.
Data 명 = sqlFetch(odbcConnectExcel("파일명.xls"), "엑셀 Sheet 명")
이 방법의 단점은 Windows 에서 실행한 R에서만 사용할 수 있다는 것이다. Mac 에서 실행한 R에서는 사용할 수가 없다. 기존의 방법대로 CVS 파일 등으로 변환을 해야 한다. ㅡㅡ;;
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| Odds ratio (0) | 2009/10/06 |
|---|---|
| 평균치 비교 (0) | 2009/10/04 |
| Excel 불러오기 (0) | 2009/10/01 |
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
heatmap 명령어에서 hclust 에 관한 부분을 지정하는 방법은 hclustfun=XXX 이런 식이다. 따라서 새로운 함수를 만들어주면 되는 것 같다. 함수를 만드는 방법도 친절하게 가르쳐 주고 있었다.
이런 식으로하면 my.hclust 함수를 ward method를 사용한 hclust 함수로 사용하도록 할 수 있다.
이제 이런식으로 입력하면 ward method를 사용한 heatmap 을 볼 수 있게 된다.
다음번으로 시도할 부분은 원본 파일에서 자료를 새로운 Matrix로 복사시켜서 Heatmap 및 Dendrogram 그리는 것이다. 원본 파일에서 필요할 때마다 변경해서 쓰면 번거로울 테니 꼭 알아두어야 할 부분이다.
딱히 아는 것도 없이 배울려고 하니 힘들다. :(
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| 평균치 비교 (0) | 2009/10/04 |
|---|---|
| Excel 불러오기 (0) | 2009/10/01 |
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
| Boxplots (0) | 2008/07/27 |
이런걸 논문에 싣고 싶어서 만드는 방법을 알기 위해서 노력을 많이 했다. 책도 사서 보았다. 하지만 정작 문제를 해결한 것은 홈페이지에서 구할 수 있는 설명서 파일이었다. 예쁘게 만들기 위해서는 앞으로 연구를 좀 해보아야 하겠지만, 엄청나게 어렵지는 않은 것 같다. 다만, 너무 쉽게 만들어지는 것 같아서 다시 방법을 검토해 보아야겠다.
만들기 위해서 사용한 자료는 최근 유방암 환자 30명의 면역화학검사 결과이다. ER, PR 의 양성과 음성에 따라서 분명히 그룹이 지어지는 것을 볼 수가 있다.
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| Excel 불러오기 (0) | 2009/10/01 |
|---|---|
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
| Boxplots (0) | 2008/07/27 |
| Boxplot (0) | 2008/07/26 |
월요일에 발표를 하면서 느낀 것이다. 역시 공부를 해야 하겠다. 근데 이 책은 한국에 없다는거. ㅠㅠ 금전적으로 통계를 의뢰할 수도 있다고는 하지만 그래도 기본은 할 줄 알아야 하지 않을까하는게 내 생각이다. 물론 아무리 공부해보아도 통계의 의미에 대해서는 이해 못하겠지만 적어도 통계 프로그램을 돌리는 방법 정도는 배워야 할 것 같다. 비싼 SPSS 보다는 발전의 가능성이 있는 R 이 좋을 것 같다. 시간이 좀 많이 걸릴 듯 하지만 이 책을 구해보도록 노려해보아야 겠다. Microarray 와 R 과 관련이 있는 책은 참 드문 것 같다.
환율이 좀 안정화되었으면 좋겠다. 사실 아버지 월급이 달러로 들어오기 때문에 달러로 들어올 때 쯤 환율이 폭등하면 매우매우 좋지만.. 널 뛰고 있어서야 주문하기도 힘들다. 75달러 책을 국내에 들여오는데 약 12만원 정도.. 예전에는 조금 더 저렴했을텐데.. :(
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| Excel 불러오기 (0) | 2009/10/01 |
|---|---|
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
| Boxplots (0) | 2008/07/27 |
| Boxplot (0) | 2008/07/26 |
말이야 간단한 것 같지만 사실 이 것을 어떤 식으로 활용할 수 있을지에 대해서는 잘 모르겠다. 통계학 책이라도 구해봐야하는지...
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| Excel 불러오기 (0) | 2009/10/01 |
|---|---|
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
| Boxplots (0) | 2008/07/27 |
| Boxplot (0) | 2008/07/26 |
숫자뿐에 지나지 않은 자료를 간단한 명령어를 많으로도 Boxplot이 만들어지는 것을 보니깐 세상 참 좋아졌다.
Welch Two Sample t-test 라는 것도 있던데.. 역시 통계는 무슨 말인지를 알 수가 없다. 이해 불가능한 영역에 속하는 학문인것 같다.
'공부해 봅시다 > R-Project' 카테고리의 다른 글
| Excel 불러오기 (0) | 2009/10/01 |
|---|---|
| 함수 지정하기..ㅡㅡ (0) | 2009/06/23 |
| Heatmap (4) | 2009/06/21 |
| 역시 공부 (2) | 2008/11/26 |
| Boxplots (0) | 2008/07/27 |
| Boxplot (0) | 2008/07/26 |

Prev




