Skip to content

minjijuliakang/r4ds

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 

Repository files navigation

r4ds

#강의요약 'Tidyverse part_1'

  • tidyverse 6가지 기능 :select, filter, arrange, mutate, summarize, group_by 파이프기능을 사용하면 내용을 이해하기쉽다.

#강의요약 "Tidyverse part_2'

  • select 원하는 컬럼만 추출(변수명, 변수번호) 또는 특정변수만 제거 (select (-(1:5) 또는 공통된 단어 contains('y3'), starts_with, ends_with 또는 변수명변경 (새로운이름 앞) 변수순서 변경 (

#강의요약 "Tidyverse part_3'

  • filter 작은 데이터셋을 만들어서 사용, 복합조건가능 between 복합조건 OR (|) 더 복합조건 AND , OR ( & ) | ( & ) 조건을 만족하지 않는 경우 (=!) 해당변수 카운트 (count=) 결측값 카운트 (is.na) 또는 결측값이 아닌것 (!is.na) 결측값이 있는 건 제외 =drop (drop.na)

#강의요약 "Tidyverse part_4'

  • mutate 새로운 변수 생성 조건을 이용한 새로운 변수 생성 -> ifelse(조건, 조건이 참일경우, 조건이 거짓일경우) ifelse: 조건에 따라 그룹핑할때 enter를 하면 가독성이 올라감. 변수복합조건: high, intermediate, high risk id의 누적합계: sumid 변수생성 여러개의 변수 생성 연속변수를 범주형으로 그룹핑 cut (해당 variaebl, c'나눌구간' , c'구간의 이름' ) -> ex) cut (age, c(c-inf,30,40,50,60,inf), c('<30','>=30', '>=40',))) cut_interval(age, n=4)

#강의요약 "Tidyverse part_5'

  • arrange 정렬 우선순위대로 재배열
  • summarize 개별의 데이터가 아니라, aggregation function 요약정보 동시에 구함 incidence person-year eventrate -> ex) summarize (pt_number = n (), event = sum (hcc) person_year = sum(hcc_yr), incidence_rate = event
  • group_by 일부 변수를 기준을 나누어서 사용 +summarize :그룹을 나누고, 각 그룹에 속한 수 및 평균값을 구할수있음 (주의: mean, median 사용시에 na.rm 을 사용하여 결측값처리)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published