투자/젠포트

우선순위와 데이터 스케일링

포오옥 2021. 4. 19. 08:47
728x90

우선순위를 정할 때, 위 그림과 같은 실수를 할 경우가 있습니다.

의도했다면 다행이지만, 아니라면 굉장히 왜곡된 결과가 나옵니다.

예를들어 우선순위가 아래와 같다면, 매수조건식에 따라선 굉장히 왜곡됩니다.

'{시가총액}+{종합점수} (내림차순)'

{시가총액}은 4700000~20 정도의 범위고 종합점수는 100~0 의 범위입니다.

이럴때는 보통 '비율({시가총액},{오름차순})' 같은 방법으로 종합점수와 크기를 맞춥니다.

이렇게 크기를 맞추는 것을 데이터 스케일링이라고 합니다.

{거래대금}을 생각해 보겠습니다.

{거래대금}은 하루 동안의 거래대금을 비교하는 팩터입니다.

두 기업의 거래대금이 같을 때, 시가총액이 50억인 경우와 20000억인 경우는 다른 의미를 가집니다.

'{거래대금}/{시가총액}' 을 사용하면 어느정도 대등한 비교가 되겠군요.

기간을 정해 비교해 보는 것도 좋습니다. 오늘의 거래대금은 같은데 어제의 거래대금이 크게 차이가 난다면 그것도 의미가 있습니다.

'변화율_기간({거래대금},{2일})'

하지만 위와 같이 비교하면 상당히 넓은 범위의 음수와 양수 값을 가집니다.

스토캐스틱을 응용하여 아래와 같이 사용하면 값을 0~1 로 바꿀 수 있습니다.

'({거래대금}-최저값({거래대금},{2일}))/(최고값({거래대금},{2일})-최저값({거래대금},{2일}))'

더욱이 100을 곱해주면 점수팩터와 같은 크기로 스케일링됩니다.

'(({거래대금}-최저값({거래대금},{2일}))/(최고값({거래대금},{2일})-최저값({거래대금},{2일})))*100'

참고) 젠포트는 현재 사칙연산의 적용이 불안정해서 꼭 괄호를 쳐야 합니다.

{시가총액}을 우선순위에 써 놓고 뒤에 무엇을 더하거나 빼도 결과가 변하지 않아서 생각해 보았습니다.

비교할 때는 비교대상 간의 크기를 맞추어야 합니다.

반응형

'투자 > 젠포트' 카테고리의 다른 글

조건식 글자 수를 줄이는 법  (0) 2021.09.27
젠포트 전략 개선 방법  (0) 2021.07.12
마켓타이밍 비교  (0) 2021.05.13
2021/4/30 젠포트 현황  (0) 2021.04.30
젠포트에서 오름차순과 내림차순  (1) 2021.04.18