티스토리 뷰

728x90

보스턴 데이터셋이 윤리적인 문제로 없어졌다고 합니다.

 

더이상 from sklearn.datasets import load_boston 이 안된다고 하네요.

 

그래도 회귀분석 예제에 써야하니까

 

이렇게 남깁니다. 

boston_data.csv
0.03MB

 

- CRIM: 지역별 범죄 발생률
- ZN: 25,000평방피트를 초과하는 거주 지역의 비율
- INDUS: 비상업 지역 넓이 비율
- CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
- NOX: 일산화질소 농도
- RM: 거주할 수 있는 방 개수
- AGE: 1940년 이전에 건축된 소유 주택의 비율
- DIS: 5개 주요 고용센터까지의 가중 거리
- RAD: 고속도로 접근 용이도
- TAX: 10,000달러당 재산세율
- PTRATIO: 지역의 교사와 학생 수 비율
- B: 지역의 흑인 거주 비율
- LSTAT: 하위 계층의 비율
- MEDV: 본인 소유의 주택가격 (중앙값)

 

728x90
댓글