چکیده: در این پژوهش به طراحی سامانه هوشمند جهت زمانبندی چراغهای راهنمایی پرداختیم در این راه از یادگیری تقویتی که یکی از روشهای هوش مصنوعی برای حل مسائل پیچیده است استفاده گردید. برای بهکارگیری یادگیری تقویتی، یک محیط شبیهسازی ضروری است که عامل هوشمند بتواند با آزمونوخطا در آن یاد بگیرد و به هدف خود برسد. دوقلو دیجیتال به عنوان یک نمونه دیجیتالی از سیستم فیزیکی کمککننده در این موضوع است، با طراحی یک دوقلوی دیجیتال از محور بهشتی تهران، الگوریتمهای زمانبندی چراغهای راهنمایی را در این محور ارزیابی کردیم. سامانه طراحیشده شامل سه زیرسامانه است: زیرسامانه یادگیری تقویتی، زیرسامانه دوقلوی دیجیتال و زیرسامانه تشخیص خودرو. هدف از دو زیرسامانه اول، شبیهسازی شرایط ترافیکی و ارائه زمانبندی گروهی چراغهای راهنمایی است و هدف از زیرسامانه تشخیص خودرو، تحلیل شرایط ترافیکی و انتقال دادهها به عامل یادگیری تقویتی است. به دلیل عدم دسترسی به دادههای واقعی، از دادههای مرکز کنترل ترافیک تهران برای شبیهسازی استفاده شد. نتایج نشان داد که ساختار مناسب برای زمانبندی چراغهای راهنمایی چگونه باید باشد و تحلیلهای کمی نشان داد که الگوریتمهای یادگیری تقویتی میتوانند نرخ گذردهی خودروها در شهر تهران را تا ۲۲ درصد افزایش دهد این مقایسه نسبت به شرایط کنونی شهر تهران و نتیجه ارزیابی نتایج نرمافزار مدیریت ترافیک شهر تهران به اسم SCATS میباشد.