Logistic regression
A. Extension of multiple regression but the dv is categorical
B. Value being predicted represents a probability, and it varies between 0 and 1
C. Possible to use categorical ivs (dummy coded, but won’t here)
D. Key concept: logit
1. natural logarithm (ln) of the odds
2.
3. Therefore, prob success + ? + + + +
E. SPSS (example with the Helping3.sav data set)
1.
What’s Business Intelligence(BI) ?
Set of applications and technologies of approaching, gathering, storing, analyzing data for quick and correct decision-making.
It includes
{data mining, data base& data warehouse, statistic analytics, prediction etc}
“An umbrella term to describe concepts and methods to improve business decision making by using fact-based support systems."
Data의 10%씩을 가진다)
3열은 전체 데이터세트 중 평가용 데이터의 누적 퍼센트를 나타낸다.
4열은 모형에 의해 정의된 각 십분위에서의 평균 활성화 확률(Predicted probabilities*100)이다.
5열은 평가용 데이터세트를 사용한 각 십분위에서 평균 활성화 비율(Probability chd)이다. 이 값은 평가용 데이터세트의
Forecasting period :
5 days
We predict day demands.
So, the time horizon of our forecast is a short term forecasting.
New forecast
= Last period’s forecast + α(Last period’s actual demand – Last period’s forecast)
Recent data is reflected considerably.
More objective than others (Only α is subjective)
At lunch, after first class, before graduate school class and
다차원 자료의 시각화를 위한 여러 가지 고난도의 방법들이 개발되고 있다.
- Exploratory Data Analysis(EDA) : 탐색적 데이터 분석(EDA)은 사전에 설정된 가정이나 모형에 의존하지 않고 데이터를 탐색하여 흥미 있는 패턴들을 밝히려고 시도한다. 시각과 직관을 위해 데이터의 그래픽 표현이 흔히 사용된다.