| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- isdigit()
- isnumeric()
- 파이썬
- 프로그래머스
- isalpha()
- 그래프 탐색
- 알고리즘
- Deque
- DP
- Algorithm
- explainable recommendation
- 자료구조
- 우선순위 큐
- bfs
- knowledge
- isalnum()
- 그래프
- 추천시스템
- kg
- 코테
- Recommendation
- 동적 프로그래밍
- LSTM
- 백준
- 정렬
- Knowledge graph
- find()
- Python
- Dynamic Programming
- Stack
Archives
- Today
- Total
데린이 고인물되기
[KG]PGPR을 읽고 ReMR을 읽으면서 느낀 둘 사이의 연관성 본문
반응형
일개 학부생의 생각이므로 틀린 내용이 많을 수 있습니다..
| 목적 | PGPR | ReMR |
| 검색 공간을 줄이고 효율적 경로 탐색 | action pruning strategy, beam search-based algorithm |
top-down 전략 |
| policy-guided path searching 을 가능하게 하기 위해 강화학습 사용 | 지식 그래프 + RL | 지식 그래프 + RL |
| level에 대해 특별히 언급 X. ReMR 관점에서 굳이 따져보자면 single-level reasoning 으로볼 수 있을 듯. ReMR에서 PGPR을 single-level reasoning이라고는함. |
multi-level reasoning | |
| 하나의 KG에서 경로 추론 | ontology-view KG와 instance-vies KG, 2가지 유의 KG를결합해 경로 추론 | |
| instance view KG에서 user와 item간의 관계를 만들때 PGPR도 참고한 듯 | ||
| 하나의 KG에 엔티티로 item, category, 등등이 있음 | category를 item의 상위 개념으로 들어가서 categroy가 item의 parents(상위 항목)로 취급됨. 이때 단순화를 위해 여기서는 각 concept의 상위 1개 parent 항목만 고려하는데, 이때 이 parent를 고를 때 ant-colony 알고리즘과 cascading Actor-critic 알고리즘에서 샘플링 방법을 약간 수정한걸 사용함. |
|
| 높은 reward를 얻는 방향으로 최적화 할때 사용되는 방법 | policy gradient |
반응형