-
๐ Ch04 Agent and Search ๐๐ฎ ํ๊ต ๊ณต๋ถ/๐ ์ธ๊ณต์ง๋ฅ๊ฐ๋ก 2025. 6. 24. 21:12
1. Problem-Solving Agents ๋ฌธ์ ํด๊ฒฐ ์์ด์ ํธ
Agent ์์ด์ ํธ
์ผ์๋ฅผ ํตํด ํ๊ฒฝ์ ๊ฐ์งํ๊ณ actuator๋ฅผ ํตํด ํด๋น ํ๊ฒฝ์ ๋ฐ๋ผ ์๋ํ๋ ๊ฒ์ผ๋ก ๋ณผ ์ ์๋ ๋ชจ๋ ๊ฒ
์ธ๊ฐ, ๋ก๋ด, ์ํํธ๋ด, ์จ๋ ์กฐ์ ์ฅ์น ๋ฑ๋ฑ
agent function์ ์ธ์ง ์ด๋ ฅ์ผ๋ก๋ถํฐ ํ๋์ผ๋ก ์ฎ์
f : P* -> A
์์ด์ ํธ ํ๋ก๊ทธ๋จ์ f๋ฅผ ์์ฑํ ๋ฌผ๋ฆฌ์ ์ํคํ ์ฒ์์ ์คํ๋จ
The Nature of Environments ํ๊ฒฝ์ ๋ณธ์ง
PEAS
ํฉ๋ฆฌ์ ์์ด์ ํธ๋ฅผ ์ค๊ณํ๋ ค๋ฉด, ์์ ํ๊ฒฝ์ ์ง์ ํด์ผ ํจ
์ฑ๋ฅ, ํ๊ฒฝ, ์ก์ถ์์ดํฐ, ์ผ์
์์ ํ๊ฒฝ์ ์์ฑ
์์ ํ ๊ด์ฐฐ ๊ฐ๋ฅ vs ๋ถ๋ถ์ ์ผ๋ก ๊ด์ฐฐ ๊ฐ๋ฅ
๊ฒฐ์ ๋ก ์ vs ํ๋ฅ ๋ก ์ (๋น๊ฒฐ์ ๋ก ์ )
์ํผ์๋ํ vs ์์ฐจํ
์ ์ vs ๋์
์ด์ฐ vs ์ฐ์
๋จ์ผ ์์ด์ ํธ vs ๋ค์ค ์์ด์ ํธ
ํ๊ฒฝ ์ ํ์ ์์ด์ ํธ ๋์์ธ์ ํฌ๊ฒ ๊ฒฐ์ ํจ
์์ด์ ํธ ์ ํ
์ผ๋ฐ์ ์ด ์ฆ๊ฐํ๋ ์์
Simple reflex agents / Model-based reflex agents / Goal-based agents ๋ฑ
Table driven agents ํ ์ด๋ธ ๊ธฐ๋ฐ ์์ด์ ํธ
์คํจํ ์ด๋ช ...
-
AI์ ํต์ฌ ๊ณผ์ ๋ ๊ฐ๋ฅํ ํ ๊ฑฐ๋ํ ํ ์ด๋ธ๋ณด๋ค๋ ์์ ํ๋ก๊ทธ๋จ์ผ๋ก๋ถํฐ
ํฉ๋ฆฌ์ ์ธ ํ๋์ ์ด๋์ด๋ด๋ ํ๋ก๊ทธ๋จ์ ์์ฑํ๋ ๋ฐฉ๋ฒ์ ์ฐพ๋ ๊ฒ
-
Simple reflex agents ๋จ์ ๋ฐ์ฌ ์์ด์ ํธ
๋๋จธ์ง ์ง๊ฐ ์ด๋ ฅ์ ๋ฌด์ํ๊ณ , ํ์ฌ ์ธ์์ ๋ฐ๋ผ ์กฐ์น ์ ํ
Model-based reflex agents ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐ์ฌ ์์ด์ ํธ
์ง๊ฐ ์ด๋ ฅ์ ๋ฐ๋ผ ์ด๋ค ์ข ๋ฅ์ ๋ด๋ถ ์ํ๋ฅผ ์ ์งํ๊ณ , ์ด๋ฅผ ํตํด ํ์ฌ ์ํ์ ๊ด์ฐฐ๋์ง ์์ ์ธก๋ฉด ์ค ์ผ๋ถ๋ฅผ ์ต์ํ ๋ฐ์
Goal-based agents ๋ชฉํ ๊ธฐ๋ฐ ์์ด์ ํธ
๋ชฉํ์ ๋ํ ๋ฐ๋์งํ ์ํฉ์ ๋ฌ์ฌํ๋ ์ด๋ค ์ข ๋ฅ์ ์ ๋ณด๊ฐ ํ์ํจ
State ์ํ
์์ด์ ํธ์ ๊ทธ ํ๊ฒฝ์ ๊ตฌ์ฑ
initial state ์ด๊ธฐ ์ํ
์์ด์ ํธ๊ฐ ์์ํ๋ ์ํ
actions
์ํ์์ ๋ด๋ฆด ์ ์๋ ์ ํ
actions(s)๋ s ์ํ์์ ์คํ๋ ์ ์๋ action ์ธํธ๋ฅผ ๋ฐํ
transition model ์ ํ ๋ชจ๋ธ
ํด๋น ์ํ์์ ์ ์ฉ ๊ฐ๋ฅํ action์ ์ํํ๋ฉด ์ด๋ค ์ํ๊ฐ ๋ฐ์ํ๋์ง์ ๋ํ ์ค๋ช
result(s, a) ๋ state์์ ์์ ์ ์ํํ ๊ฒฐ๊ณผ์ ์ํ๋ฅผ ๋ฐํ
state space ์ํ ๊ณต๊ฐ
์ด๊ธฐ ์ํ์์ ๋ชจ๋ ๋์ ์ํ์ค๋ฅผ ํตํด ๋๋ฌํ ์ ์๋ ๋ชจ๋ ์ํ์ ์งํฉ
goal test
์ฃผ์ด์ง ์ํ๊ฐ ๋ชฉํ ์ํ์ธ์ง ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒ
ex) ๋ค๋น๊ฒ์ดํฐ ์ฑ์์ goal test๋ ์์ด์ ํธ์ ํ์ฌ ์์น๊ฐ ๋ชฉ์ ์ง์ ์๋์ง ์ฌ๋ถ
Path Cost ๊ฒฝ๋ก ๋น์ฉ
์ฃผ์ด์ง ๊ฒฝ๋ก์ ๊ด๋ จ๋ ์์น์ ๋น์ฉ
๋ชฉํ ์ํ์ ๋๋ฌํ ์ ์๋ ๊ฐ์ฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ์ ์ฐพ๋ ๊ฒ
๋ฌธ์ ๋ฐ ํด๊ฒฐ์ฑ ๊ฒ์
๋ฌธ์ ์ ์ <initial state, actions, transition model, goal test, path cost>
๋ฌธ์ ์ ๋ํ ์ต์ ์ ํด๊ฒฐ์ฑ ์ ์ต์ ๋น์ฉ์ผ๋ก ์ด๊ธฐ ์ํ์์ ๋ชฉํ ์ํ๋ก ์ด์ด์ง๋ ํ๋ ์์
state space์์์ ํ์์ผ๋ก์์ ๋ฌธ์ ํด๊ฒฐ
๋ชฉํ ์ค์ : ๋ชฉํ๋ ๋ชฉ์ ์ ์ ํํจ์ผ๋ก์จ ํ๋์ ์กฐ์งํจ
๋ฌธ์ ๊ณต์ํ : ๊ณ ๋ ค๋์ด์ผํ๋ ๋์๊ณผ ์ํ๊ฐ ์ํ๋์ด์ผ ํ๋์ง ๊ฒฐ์ ํ๋ ๊ณผ์
๊ฒ์ : state space์ ๋ชฉํ์ ๋๋ฌํ๋ ์ผ๋ จ์ ๋์์ ์ฐพ๋ ๊ณผ์
์คํ : ์์ด์ ํธ๋ ์๋ฃจ์ ์ ์์ ์ ํ ๋ฒ์ ํ๋์ฉ ์คํํ ์ ์์
์ด์ด์...
'๐ฎ ํ๊ต ๊ณต๋ถ > ๐ ์ธ๊ณต์ง๋ฅ๊ฐ๋ก ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๐ Ch06 Uncertainty ๐ (0) 2025.06.25 ๐ Ch05 Knowledge ๐ (0) 2025.06.24 ๐ Ch03 Data Preprocessing ๐ (0) 2025.06.24 ๐ Ch02 Data Analysis Part 1 ๐ (0) 2025.06.22 ๐ Ch01 Introductions of AI ๐ (0) 2025.06.22