ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ๐Ÿ€ Ch04 Agent and Search ๐Ÿ€
    ๐Ÿฎ ํ•™๊ต ๊ณต๋ถ€/๐Ÿ€ ์ธ๊ณต์ง€๋Šฅ๊ฐœ๋ก  2025. 6. 24. 21:12

    1. Problem-Solving Agents ๋ฌธ์ œ ํ•ด๊ฒฐ ์—์ด์ „ํŠธ

    Agent ์—์ด์ „ํŠธ

    ์„ผ์„œ๋ฅผ ํ†ตํ•ด ํ™˜๊ฒฝ์„ ๊ฐ์ง€ํ•˜๊ณ  actuator๋ฅผ ํ†ตํ•ด ํ•ด๋‹น ํ™˜๊ฒฝ์— ๋”ฐ๋ผ ์ž‘๋™ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ๊ฒƒ

    ์ธ๊ฐ„, ๋กœ๋ด‡, ์†Œํ”„ํŠธ๋ด‡, ์˜จ๋„ ์กฐ์ ˆ ์žฅ์น˜ ๋“ฑ๋“ฑ

    agent function์€ ์ธ์ง€ ์ด๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ํ–‰๋™์œผ๋กœ ์—ฎ์Œ

    f : P* -> A

    ์—์ด์ „ํŠธ ํ”„๋กœ๊ทธ๋žจ์€ f๋ฅผ ์ƒ์„ฑํ•  ๋ฌผ๋ฆฌ์  ์•„ํ‚คํ…์ฒ˜์—์„œ ์‹คํ–‰๋จ

    The Nature of Environments ํ™˜๊ฒฝ์˜ ๋ณธ์งˆ

    PEAS

    ํ•ฉ๋ฆฌ์  ์—์ด์ „ํŠธ๋ฅผ ์„ค๊ณ„ํ•˜๋ ค๋ฉด, ์ž‘์—… ํ™˜๊ฒฝ์„ ์ง€์ •ํ•ด์•ผ ํ•จ

    ์„ฑ๋Šฅ, ํ™˜๊ฒฝ, ์•ก์ถ”์—์ดํ„ฐ, ์„ผ์„œ

    ์ž‘์—… ํ™˜๊ฒฝ์˜ ์†์„ฑ

    ์™„์ „ํžˆ ๊ด€์ฐฐ ๊ฐ€๋Šฅ vs ๋ถ€๋ถ„์ ์œผ๋กœ ๊ด€์ฐฐ ๊ฐ€๋Šฅ

    ๊ฒฐ์ •๋ก ์  vs ํ™•๋ฅ ๋ก ์ (๋น„๊ฒฐ์ •๋ก ์ )

    ์—ํ”ผ์†Œ๋“œํ˜• vs ์ˆœ์ฐจํ˜•

    ์ •์  vs ๋™์ 

    ์ด์‚ฐ vs ์—ฐ์†

    ๋‹จ์ผ ์—์ด์ „ํŠธ vs ๋‹ค์ค‘ ์—์ด์ „ํŠธ

    ํ™˜๊ฒฝ ์œ ํ˜•์€ ์—์ด์ „ํŠธ ๋””์ž์ธ์„ ํฌ๊ฒŒ ๊ฒฐ์ •ํ•จ

    ์—์ด์ „ํŠธ ์œ ํ˜•

    ์ผ๋ฐ˜์ ์ด ์ฆ๊ฐ€ํ•˜๋Š” ์ˆœ์„œ

    Simple reflex agents / Model-based reflex agents / Goal-based agents ๋“ฑ

    Table driven agents ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ

    ์‹คํŒจํ•  ์šด๋ช…...

    -

    AI์˜ ํ•ต์‹ฌ ๊ณผ์ œ๋Š” ๊ฐ€๋Šฅํ•œ ํ•œ ๊ฑฐ๋Œ€ํ•œ ํ…Œ์ด๋ธ”๋ณด๋‹ค๋Š” ์ž‘์€ ํ”„๋กœ๊ทธ๋žจ์œผ๋กœ๋ถ€ํ„ฐ

    ํ•ฉ๋ฆฌ์ ์ธ ํ–‰๋™์„ ์ด๋Œ์–ด๋‚ด๋Š” ํ”„๋กœ๊ทธ๋žจ์„ ์ž‘์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ๋Š” ๊ฒƒ

    -

    Simple reflex agents ๋‹จ์ˆœ ๋ฐ˜์‚ฌ ์—์ด์ „ํŠธ

    ๋‚˜๋จธ์ง€ ์ง€๊ฐ ์ด๋ ฅ์„ ๋ฌด์‹œํ•˜๊ณ , ํ˜„์žฌ ์ธ์‹์— ๋”ฐ๋ผ ์กฐ์น˜ ์„ ํƒ

    Model-based reflex agents ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฐ˜์‚ฌ ์—์ด์ „ํŠธ

    ์ง€๊ฐ ์ด๋ ฅ์— ๋”ฐ๋ผ ์–ด๋–ค ์ข…๋ฅ˜์˜ ๋‚ด๋ถ€ ์ƒํƒœ๋ฅผ ์œ ์ง€ํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ํ˜„์žฌ ์ƒํƒœ์˜ ๊ด€์ฐฐ๋˜์ง€ ์•Š์€ ์ธก๋ฉด ์ค‘ ์ผ๋ถ€๋ฅผ ์ตœ์†Œํ•œ ๋ฐ˜์˜

    Goal-based agents ๋ชฉํ‘œ ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ

    ๋ชฉํ‘œ์— ๋Œ€ํ•œ ๋ฐ”๋žŒ์งํ•œ ์ƒํ™ฉ์„ ๋ฌ˜์‚ฌํ•˜๋Š” ์–ด๋–ค ์ข…๋ฅ˜์˜ ์ •๋ณด๊ฐ€ ํ•„์š”ํ•จ

     

     

    State ์ƒํƒœ

    ์—์ด์ „ํŠธ์™€ ๊ทธ ํ™˜๊ฒฝ์˜ ๊ตฌ์„ฑ

    initial state ์ดˆ๊ธฐ ์ƒํƒœ

    ์—์ด์ „ํŠธ๊ฐ€ ์‹œ์ž‘ํ•˜๋Š” ์ƒํƒœ

    actions 

    ์ƒํƒœ์—์„œ ๋‚ด๋ฆด ์ˆ˜ ์žˆ๋Š” ์„ ํƒ

    actions(s)๋Š” s ์ƒํƒœ์—์„œ ์‹คํ–‰๋  ์ˆ˜ ์žˆ๋Š” action ์„ธํŠธ๋ฅผ ๋ฐ˜ํ™˜

    transition model ์ „ํ™˜ ๋ชจ๋ธ

    ํ•ด๋‹น ์ƒํƒœ์—์„œ ์ ์šฉ ๊ฐ€๋Šฅํ•œ action์„ ์ˆ˜ํ–‰ํ•˜๋ฉด ์–ด๋–ค ์ƒํƒœ๊ฐ€ ๋ฐœ์ƒํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์„ค๋ช…

    result(s, a) ๋Š” state์—์„œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ์˜ ์ƒํƒœ๋ฅผ ๋ฐ˜ํ™˜

    state space ์ƒํƒœ ๊ณต๊ฐ„

    ์ดˆ๊ธฐ ์ƒํƒœ์—์„œ ๋ชจ๋“  ๋™์ž‘ ์‹œํ€€์Šค๋ฅผ ํ†ตํ•ด ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ์ƒํƒœ์˜ ์ง‘ํ•ฉ

    goal test 

    ์ฃผ์–ด์ง„ ์ƒํƒœ๊ฐ€ ๋ชฉํ‘œ ์ƒํƒœ์ธ์ง€ ์—ฌ๋ถ€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•

    ex) ๋„ค๋น„๊ฒŒ์ดํ„ฐ ์•ฑ์—์„œ goal test๋Š” ์—์ด์ „ํŠธ์˜ ํ˜„์žฌ ์œ„์น˜๊ฐ€ ๋ชฉ์ ์ง€์— ์žˆ๋Š”์ง€ ์—ฌ๋ถ€

    Path Cost ๊ฒฝ๋กœ ๋น„์šฉ

    ์ฃผ์–ด์ง„ ๊ฒฝ๋กœ์™€ ๊ด€๋ จ๋œ ์ˆ˜์น˜์  ๋น„์šฉ

    ๋ชฉํ‘œ ์ƒํƒœ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ•์„ ์ฐพ๋Š” ๊ฒƒ

    ๋ฌธ์ œ ๋ฐ ํ•ด๊ฒฐ์ฑ… ๊ฒ€์ƒ‰

    ๋ฌธ์ œ ์ •์˜ <initial state, actions, transition model, goal test, path cost>

    ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ตœ์ ์˜ ํ•ด๊ฒฐ์ฑ…์€ ์ตœ์†Œ ๋น„์šฉ์œผ๋กœ ์ดˆ๊ธฐ ์ƒํƒœ์—์„œ ๋ชฉํ‘œ ์ƒํƒœ๋กœ ์ด์–ด์ง€๋Š” ํ–‰๋™ ์ˆœ์„œ

    state space์—์„œ์˜ ํƒ์ƒ‰์œผ๋กœ์„œ์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ

    ๋ชฉํ‘œ ์„ค์ • : ๋ชฉํ‘œ๋Š” ๋ชฉ์ ์„ ์ œํ•œํ•จ์œผ๋กœ์จ ํ–‰๋™์„ ์กฐ์งํ•จ

    ๋ฌธ์ œ ๊ณต์‹ํ™” : ๊ณ ๋ ค๋˜์–ด์•ผํ•˜๋Š” ๋™์ž‘๊ณผ ์ƒํƒœ๊ฐ€ ์ˆ˜ํ–‰๋˜์–ด์•ผ ํ•˜๋Š”์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๊ณผ์ •

    ๊ฒ€์ƒ‰ : state space์˜ ๋ชฉํ‘œ์— ๋„๋‹ฌํ•˜๋Š” ์ผ๋ จ์˜ ๋™์ž‘์„ ์ฐพ๋Š” ๊ณผ์ •

    ์‹คํ–‰ : ์—์ด์ „ํŠธ๋Š” ์†”๋ฃจ์…˜์˜ ์ž‘์—…์„ ํ•œ ๋ฒˆ์— ํ•˜๋‚˜์”ฉ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Œ

     

    ์ด์–ด์„œ...

     

Designed by Tistory.