•  Persian
    • Persian
    • English
  •   ورود
  • دانشگاه فردوسی مشهد
  • |
  • مرکز اطلاع‌رسانی و کتابخانه مرکزی
    • Persian
    • English
  • خانه
  • انواع منابع
    • مقاله مجله
    • کتاب الکترونیکی
    • مقاله همایش
    • استاندارد
    • پروتکل
    • پایان‌نامه
  • راهنمای استفاده
Search 
  •   کتابخانه دیجیتال دانشگاه فردوسی مشهد
  • Search
  •   کتابخانه دیجیتال دانشگاه فردوسی مشهد
  • Search
  • همه
  • عنوان
  • نویسنده
  • سال
  • ناشر
  • موضوع
  • عنوان ناشر
  • ISSN
  • شناسه الکترونیک
  • شابک
جستجوی پیشرفته
JavaScript is disabled for your browser. Some features of this site may not work without it.

Search

Show Advanced FiltersHide Advanced Filters

Filters

Use filters to refine the search results.

نمایش تعداد 1-10 از 158

    • Relevance
    • Title Asc
    • Title Desc
    • سال صعودی
    • سال نزولی
    • 5
    • 10
    • 20
    • 40
    • 60
    • 80
    • 100
  • خروجی
    • CSV
    • RIS
    • Sort Options:
    • Relevance
    • Title Asc
    • Title Desc
    • Issue Date Asc
    • Issue Date Desc
    • Results Per Page:
    • 5
    • 10
    • 20
    • 40
    • 60
    • 80
    • 100

    Learning Concepts from a Sequence of Experiences by Reinforcement Learning Agents 

    نوع: Conference Paper
    نویسنده : Farzad, Rastegar; Majid, Nili Ahmadabadi
    Request PDF

    One armed bandit process with a covariate 

    نوع: Journal Paper
    نویسنده : Liang, Y. - Wang, X. - Yi, Y.
    ناشر: Springer
    سال: 2013

    The learning of longitudinal human driving behavior and driver assistance strategies 

    نوع: Journal Paper
    ناشر: Elsevier Science
    سال: 2013

    Reinforcement learning based design of sampling policies under cost constraints in Markov random fields: Application to weed map reconstruction 

    نوع: Journal Paper
    ناشر: Elsevier Science
    سال: 2014

    Using control theory for analysis of reinforcement learning and optimal policy properties in grid-world problems 

    نوع: Conference Paper
    نویسنده : سیّدمصطفی کلامی هریس; محمدباقر نقیبی سیستانی; ناصر پریز; Seyyed Mostapha Kalami; Mohammad Bagher Naghibi Sistani; Naser Pariz
    سال: 2009
    خلاصه:

    Markov Decision Process (MDP) has enormous applications in science, engineering, economics and management. Most of decision processes have Markov property and can be modeled as MDP. Reinforcement Learning (RL) is an approach to deal with MDPs. RL...

    How Behavior Trees modularize robustness and safety in hybrid systems 

    نوع: Conference Paper
    نویسنده : Colledanchise, M.; Ogren, P.
    ناشر: IEEE
    سال: 2014

    A compact cylindrical dielectric resonator antenna for MIMO applications 

    نوع: Conference Paper
    ناشر: IEEE
    سال: 2014

    A fast filtering algorithm using the transmission mechanism of human auditory information and its application on quadruped robot speed tracking 

    نوع: Conference Paper
    ناشر: IEEE
    سال: 2014

    Task-Based Decomposition of Factored POMDPs 

    نوع: Journal Paper
    نویسنده : Shani, Guy
    ناشر: IEEE
    سال: 2014

    Reducing the analog-digital productivity gap using time-mode signal processing 

    نوع: Conference Paper
    نویسنده : Roberts, G.W.
    ناشر: IEEE
    سال: 2014
    • 1
    • 2
    • 3
    • 4
    • . . .
    • 16

    نویسنده

    ... View More

    ناشر

    سال

    کلیدواژه

    ... View More

    نوع

    زبان

    نوع محتوا

    عنوان ناشر

    ... View More
    • درباره ما
    نرم افزار کتابخانه دیجیتال "دی اسپیس" فارسی شده توسط یابش برای کتابخانه های ایرانی | تماس با یابش
    DSpace software copyright © 2019-2022  DuraSpace