일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 그라파나
- 하이브리드앱
- 하이퍼레저 패브릭
- 파이썬 머신러닝
- 파이썬 강좌
- 스위프트
- 엔터프라이즈 블록체인
- play2 강좌
- Golang
- hyperledger fabric
- Play2
- Play2 로 웹 개발
- 안드로이드 웹뷰
- akka 강좌
- Hyperledger fabric gossip protocol
- 파이썬 데이터분석
- 이더리움
- 스칼라
- Adapter 패턴
- 주키퍼
- 스칼라 동시성
- CORDA
- Actor
- 파이썬
- Akka
- 플레이프레임워크
- play 강좌
- 스칼라 강좌
- 파이썬 동시성
- 블록체인
- Today
- Total
HAMA 블로그
빅데이터, 스마트 에너지 그리고 예측 분석 with KNIME 본문
빅데이터, 스마트 에너지 그리고 예측 분석 with KNIME
[하마] 이승현 (wowlsh93@gmail.com) 2015. 11. 2. 11:02https://www.knime.org/files/knime_bigdata_energy_timeseries_whitepaper.pdf 요약
요약
"빅데이터" 컨셉을 둘러싼 주요 토픽중에 하나는 거대한 시간기반 데이터 또는 검침(telemetry) 데이터의 활용이다.의미있는 분석에 사용하고자 더욱 더 상세한 데이터를 얻는게 저비용의 획득 및 저장 디바이스의 출현과 함께 가능해지고있다.
데이터에 대한 매우 높은 상세 해상도는 주로 시간을 말하는데, (역주: 이전에 전력회사는 과금을 위해서 가정당 한달에 하나정도의 데이터만 필요했다면, 이제는 수요조절등을 위해서 1분당 혹은 1초당 데이터가 필요해질수있다.)
요즘, 시간 스트리밍 데이터는 기반 시스템에 대해 더 잘 알기위해 또는 높은 정확도로 미래 사건을 예측하기위해 거의 모든 디바이스로부터 기록될수있는 환경이 조성되고있다.
이 작업은 아일랜드 스마트 에너지 모의운용에서 나온 - 각각의 미터 IDs 와 함께 시간당 모니터링된 6000 가구와 회사의 전력사용을 통한 - 데이터에 촛점을 맞추고있다.
이 프로젝트의 주요 목적은 2가지가있다:
- 고객 맞춤 계약을 정의하기위한 능력 키우기
- 미래에 전력부족 및 전력과잉으로부터 전기 회사를 방어하기위한 전기사용 예측
6000 의 커스터마이징된 계약 제공 정의는 사실 현실적이진 않다. (실제는 훨씬 많다) 목적은 고객 맞춤 계약을 정의하기위한, 공통적인 전기사용 행동양식 을 가진 작은 그룹을 정의하게 되는것이다. 그러므로 이 프로젝트의 첫번째 단계는 - 데이터를 수집하고, 정제하고 변환한 후에 - 전기 사용 행동에 관한 각각의 미터 ID 를 나타내기 위한 몇몇개의 측정치를 정의하는 것 이었다.
그런 측정치들은 오리지널 6000 미터 IDs 를 전기사용에 관해 비슷한 행동양식을 가진 미터 IDs 를 포함한 최대치 30 클러스터로 그룹 짓기 위해 사용되었다. 그 클러스터의 전기사용수치에 대한 평균 타임시리즈는 클러스터 타임시리즈 프로토타입으로서 채택되었다.
두번째 목적이 염두되는 한도에서 - 즉 전기소비에 대한 예측같은 - 몇몇 옵션들이 활용된다.
그 예측은 전체 에너지 사용량을 염두할수있다. 그러나 정확치 않을수도있고 기저 사용 패턴이 너무 일반적일수도있다.
스케일의 다른 쪽 끝부분은 미래 에너지 사용은 각각의 미터 ID 에 대해 예측될수있다. 이것은 문제를 오버해석할수도 있는데 마지막 결과의 매우 어려운 해석에 도달하기위해 과도한 양의 계산을 하기 때문이다.
절충안으로서, 우리는 오직 시간상 어떤 포인트에서 전체 전기사용의 부분적 수치로서 클러스터의 프로토타입 타임시리즈에 촛점을 맞추었다. 자동회귀(auto-regressive) 모델은 각각 그것의 과거에 기반하여 미래의 타임시리즈를 예측하는것으로 채택되었다. 이 프로젝트는 또한 "빅데이터" 기회를 부가적으로 제공했다. 6000 meter IDs 에서 일년이 넘는 동안 매 30분 각격의 샘플을 -이것에 적합하며 파워풀한 머쉰상에서도 이 데이터의 프로세싱은 꽤 오래 걸린다 - 의미있는 많은 데이터를 생산했다.
고전적인 접근을 빅데이터 접근과 비교하면, 분석의 첫번째 부분은 KNIME 를 활용한 빅데이터 엔진을 사용하여 돌렸다.
이 논문에서 기술된 분석은 대중적으로 활용할만한 데이터 와 거대한 양의 데이터 변형 ,타임시리즈 클러스터, 타임시리즈분석적용, 그리고 예측분석 및 비지니스 판단을 위해 오픈소스 KNIME (나임) 플랫폼을 사용한다.
빅데이터 컴포넌트들이 오픈소스는 아니고 trial 로 활용할수있다. 모든 예제는 www.knime.com 웹사이트에서 다운로드할수있다.
장면 세팅 : 시간과 빅데이터
분석 접근 오버뷰 (역주: 가구당 전체 전력 사용을 분석함. 전자제품별 분석은 아님)
1. 각각의 meter ID 별로, 타임시리즈 데이터를 임포트해서 정제하고, 모읍니다. ( 하루당 / 시간당 )
2. 각 meter ID 의 전기사용에 대한 행동양식을 계산하고 정의합니다. (K-Menas)
3. 모든 meterID 를 행동양식에 기반하여 클러스터링합니다. 6000가구를 30개의 클러스터로 축소합니다. (K-Means)
4. 타임 시리즈 예측으로 옮깁니다. 각각의 클러스터는 예측 모델을 만듭니다. (과거기반으로 미래를 예측하기위해)
5. 예측 모델들을 평가합니다. 모든 값에 대한 예측 오류 나 에너지 피크등에 의해.... (AR - * / NN - * )
6. 빅데이터 플랫폼을 사용하여 스텝 1,2 의 행동측정계산을 다시 구현하고 실행합니다.
'IoT 데이터 분석 (NILM)' 카테고리의 다른 글
타임시리즈모델링을 위한 딥러닝 (0) | 2016.03.30 |
---|---|
시계열 데이터 분석 주요 논문들 (0) | 2016.02.19 |
유비쿼터스 홈 네트워크 시스템에서 은닉 마르코프 모델을 이용한 사용자 행동 상태 분석 및 예측 알고리즘 (0) | 2016.02.06 |
IoT 시대, 실시간 빅데이터 분석의 부상 - ( 기사 펌 ) (0) | 2015.11.25 |
[순차패턴] GSP / AprioriAll 알고리즘 링크 (0) | 2015.11.11 |