Saturday 17 February 2018

Weka - الفوركس تداول


ويكا 3: برامج التعدين البيانات في جافا ويكا هو مجموعة من خوارزميات التعلم الآلي لمهام استخراج البيانات. الخوارزميات يمكن إما أن تطبق مباشرة إلى مجموعة بيانات أو دعا من رمز جافا الخاص بك. ويكا يحتوي على أدوات للمعالجة المسبقة للبيانات، والتصنيف، والانحدار، والتجمع، وقواعد الجمعيات، والتصور. كما أنها مناسبة تماما لتطوير مخططات جديدة للتعلم الآلي. وجدت فقط على جزر نيوزيلندا، ويكا هو الطيور بلا طيار مع طبيعة فضولي. اسم واضح مثل هذا. والطيور يبدو مثل هذا. ويكا هو المصدر المفتوح البرمجيات الصادرة تحت رخصة جنو العمومية العامة. لقد وضعنا معا عدة دورات مجانية على الانترنت التي تعلم آلة التعلم واستخراج البيانات باستخدام ويكا. تحقق من الموقع للحصول على دورات للحصول على تفاصيل حول متى وكيفية التسجيل. أشرطة الفيديو للدورات متاحة على يوتيوب. نعم، فمن الممكن لتطبيق ويكا إلى البيانات الكبيرة مقدمة ل فكس البيانات التعدين يتيح تقديم مقدمة بسيطة وسريعة إلى واحدة من المجالات الأكثر إثارة للاهتمام اليوم - التعدين البيانات. هناك مجموعة واسعة من تطبيقات استخراج البيانات. يجب دمج دمج البيانات في تداول العملات الأجنبية. فكس، الفوركس أو العملات الأجنبية فكس هي أكبر سوق من حيث حجم التداول اليومي. لديها ثلاثة مستويات رئيسية من المشاركين: الأولاد الكبار، والمستوى المتوسط ​​والتجار بسيطة كما كنت ولي. لديها طبيعة المضاربة، وهو ما يعني أكثر من مرة ونحن لا تبادل السلع. نحن نهتم فقط للفرق وترغب في شراء منخفضة وبيع عالية أو بيع عالية وشراء منخفضة. من خلال عمليات قصيرة أو طويلة يمكننا الحصول على نقاط. اعتمادا على حجم التداول الخاص بك، وقيمة النقطة يمكن أن تتراوح بين سنت واحد إلى 10 وأكثر من ذلك. هذه هي الطريقة الرئيسية لكسب المال في سوق العملات الأجنبية (جنبا إلى جنب مع كاري التجارة، الوساطة، التحكيم وأكثر من ذلك). لاحظ أن سوق العملات الأجنبية ضخمة ولكنها مناسبة لجميع مستويات اللاعبين. فكر في سوق الفوركس كسوبر ماركت لانهائي مع عدد لا حصر له من المنتجات والعملاء، ولكن لديها أيضا عدد لا حصر له من الصرافين. وهذا يعني أن هناك قدرا متساويا من الفرص للجميع. البيانات التعدين والتعلم الآلي البيانات التعدين هو حقل فرعي ناضجة من علوم الكمبيوتر. في حوالي الكثير من البيانات واستخراج غير تافهة من المعرفة القابلة للاستخدام من كميات هائلة من البيانات. في القيام به عن طريق معالجة البيانات الذكية باستخدام خوارزميات التعلم الآلي. استخراج البيانات ليست مجرد كرود (إنشاء، قراءة وتحديث وحذف). لدينا العديد من أساليب استخراج البيانات. هنا الطرق وبعض التطبيقات. التصنيف - تصنيف البريد الإلكتروني كرسالة غير مرغوب فيها، وتصنيف معاملة على أنها احتيال. جمعية - يوتيوب يقترح لنا أشرطة الفيديو الجديدة على أساس تاريخنا. الأمازون يقترح لنا المزيد من البنود أثناء الخروج. تجميع - تحليل البيانات غير المهيكلة مثل الأخبار الاقتصادية والآراء للعثور على مجموعات مشتركة. عملية التعدين - فحص سجلات مشغلي المكالمات من أجل العثور على عمليات غير فعالة. نص التعدين - أخبار التعدين أو التحليل الفني للتعرف على الأنماط. خوارزمية التداول هو التنفيذ الآلي للخوارزمية التداول. في حالتنا، خوارزمية التداول تأتي من التعدين. يتم التداول الآلي من قبل بعض ملك لغة البرمجة. السرعة والمتانة هي النقاط الرئيسية هنا: تاجر الإنسان لا يمكن التغلب على برنامج الكمبيوتر فيما يتعلق تلك الصفات. ويمكن أن يكون هفت (تجارة عالية التردد) والبرمجة على مستوى منخفض (كما C) أو التداول على المدى الطويل والبرمجة عالية المستوى (كما جافا). ميكس خوارزمية التداول مع البيانات التعدين خلط البيانات التعدين في التداول الخوارزمية هو المهم. الشيء الأكثر أهمية هو البيانات. وهناك مبدأ بسيط ينص على أنه إذا كانت البيانات الخاصة بك ليست جيدة بما فيه الكفاية، والنماذج الخاصة بك لن تكون جيدة بما فيه الكفاية (جيغو). هو كل شيء عن خلق نموذج، تنفيذه واختباره (كما هو الحال دائما). حاليا هذا التدفق هو في الغالب اليدوي. برامج استخراج البيانات هناك العديد من الخيارات مفتوحة المصدر البرمجيات في مجال التعدين البيانات. ويكا هو إطار استخراج البيانات نشأت في جامعة وايكاتو، هاميلتون، نيوزيلندا. يتم كتابة ويكا في جافا ولها أبي كبيرة. أيضا لديك تطبيقات لمعظم خوارزميات تعلم آلة معروفة. خليط من الأدوات الجيدة أمر حيوي. هناك العديد من نماذج التداول الممكنة. إغراء عملة هو نظام التداول غبي ولكن نظام التداول. نحن بحاجة إلى استخراج البيانات للعثور على الذهب. أدوات جيدة من السهل الحصول على حظا سعيدا جدا مع التعدين. إذا كنت تبحث عن مزيد من المعلومات حول التداول فكس العلمية الخطوة التالية هي استكشاف أدوات التعدين البيانات والبيانات التاريخية. زيارة ألغونيل لمزيد من التفاصيل. يمكنك أن تجد لنا على تويتر. فيس بوك. جوجل. لينكيدين ووردبريس. MetaTrader خبير استشاري نظرا للخصائص الفريدة لأزواج العملات المختلفة، تم تصميم العديد من استراتيجيات الفوركس الكمي مع زوج عملة محدد في الاعتبار. في حين أن هذا يمكن أن تنتج العديد من استراتيجيات التداول مربحة، وهناك أيضا مزايا لتطوير الاستراتيجيات التي يمكن تداولها عبر أزواج العملات متعددة. وهذا يقدم عنصرا من عناصر التنويع يمكن أن يوفر مستوى إضافيا من الحماية السلبية. نشر دانيال فرنانديز مؤخرا نظاما صممه للتداول في كل من شركات الفوركس الأربعة الرئيسية. كان هدفه هو إيجاد نظام كان من شأنه أن يحقق سجلا حافلا لمدة 20 عاما من التداول المربح على اليورو مقابل الدولار الأميركي (غبوسد)، الجنيه الإسترليني مقابل الدولار الأمريكي (أوسدجبي)، و أوسشف. يستخدم دانيال نهج استخراج البيانات لوضع استراتيجية لتداول التخصصات الأربعة فوركس. ومن أجل بناء نظامه، استخدم دانيال برنامجه الخاص باستخراج البيانات لتحديد إشارات الدخول والخروج التي كان من شأنها أن تنتج استراتيجية تداول مربحة على كل من أزواج العملات الأربعة على مدى السنوات العشرين الماضية. ما يأتي به هو مزيج من ثلاث قواعد على أساس الأسعار التي تشكل الأساس لاستراتيجية تخصصه الفوركس. دانيال 8217s استراتيجية العملات الأجنبية استراتيجية دانيال 8217s الفوركس الكبرى هي بسيطة جدا في أن لديها دائما موقف، إما طويلة أو قصيرة، في كل من أزواج العملات الأربعة التي يتداولها. انها قواعد جميع الصفقات على الرسوم البيانية اليومية. وتستغرق هذه الاستراتيجية وقتا طويلا عند استيفاء الشروط الثلاثة التالية: تقصر الاستراتيجية عند استيفاء الشروط الثلاثة التالية: كما ترون، فإن الاستراتيجية هي في الأساس استراتيجية محسنة للاتجاه الأمثل. هذا منطقي، لأن دانيال يقول في بداية مقاله أن الاتجاه على المدى الطويل بعد الاستراتيجيات هي عموما أفضل الاستراتيجيات لتداول أسواق متعددة. قاعدة إضافية واحدة أن استراتيجية Dan8217s يجعل من استخدام أتر القائم على وقف الخسارة. يتم تعيين وقف الخسارة الثابتة في 180 من أتر 20 يوما. إذا تم تشغيل وقف الخسارة، تبقى الاستراتيجية خارج السوق حتى يتم إنشاء إشارة في الاتجاه المعاكس. ويشير الاختبار إلى أن إعادة الدخول على إشارة في نفس الاتجاه أثرت سلبا على الأداء. أداء الاختبار المسبق تظهر نتائج الاختبار المسبق التي أظهرها دانيال في منصبه أن الاستراتيجية كانت مربحة للغاية. أنتجت نسبة الفوز 45، وهو عامل ربح 1.38، ومكافأة إلى نسبة خطر 1.68. وكان أكبر دانيال 8217s قلق حول هذه الاستراتيجية هو أن فترة الحد الأقصى تمثل فترة طويلة جدا. وفقا لأرقام دانيال 8217s، كان متوسط ​​العائد السنوي 9.67. وكان هذا يتألف من 16 سنة مربحة، 4 سنوات خاسرة، وسنة واحدة أن كسر أساسا حتى. أفضل عام كان عائدا من 37.76، وكان أسوأ عام خسارة 20.2. ويشير دانيال إلى أن هذا النظام لن يمثل إستراتيجية جيدة بذاتها بسبب عوائده بالنسبة إلى السحب القصوى. ومع ذلك، فإنه يشير إلى أنه يمكن أن يكون قطعة مثيرة للاهتمام من أكبر، واستراتيجية متعددة النظم. Time سلسلة التحليل والتنبؤ مع ويكا 1 مقدمة تحليل السلاسل الزمنية هي عملية استخدام التقنيات الإحصائية لنموذج وشرح سلسلة تعتمد على الوقت من البيانات نقاط. التنبؤ بالسلاسل الزمنية هو عملية استخدام نموذج لتوليد تنبؤات (تنبؤات) للأحداث المستقبلية استنادا إلى أحداث سابقة معروفة. إن بيانات السلاسل الزمنية لها ترتيب زمني مؤقت - وهذا يختلف عن تطبيقات التعلم النمطية في مجال استخراج البيانات حيث تكون كل نقطة بيانات مثالا مستقلا للمفهوم الواجب تعلمه، ولا يهم ترتيب نقاط البيانات ضمن مجموعة بيانات. ومن أمثلة تطبيقات السلاسل الزمنية ما يلي: تخطيط القدرات، وتجديد المخزون، والتنبؤ بالمبيعات، ومستويات التوظيف في المستقبل. ويكا (غ 3.7.3) لديها الآن بيئة مخصصة لتحليل السلاسل الزمنية التي تسمح بتطوير نماذج التنبؤ وتقييمها وتصورها. هذه البيئة تأخذ شكل علامة تبويب المساعد في ويكاس الرسومية واجهة المستخدم إكسبلورر ويمكن تثبيتها عبر مدير الحزمة. ويكاس إطار سلسلة الوقت يأخذ آلة التعلم ليارنينغداتا النهج إلى النمذجة سلسلة الوقت عن طريق تحويل البيانات إلى شكل أن معيار خوارزميات التعلم المقترحة يمكن معالجة. وهو يفعل ذلك عن طريق إزالة الترتيب الزمني لأمثلة المدخلات الفردية عن طريق ترميز الاعتماد على الوقت عن طريق حقول الإدخال إضافية. ويشار إلى هذه الحقول أحيانا بمتغيرات متخلفة. كما يتم حساب مختلف المجالات الأخرى تلقائيا للسماح للخوارزميات لطراز الاتجاهات والموسمية. بعد تحويل البيانات، يمكن تطبيق أي خوارزميات الانحدار ويكاس لتعلم نموذج. وهناك خيار واضح هو تطبيق الانحدار الخطي المتعدد، ولكن يمكن تطبيق أي طريقة قادرة على التنبؤ الهدف المستمر - بما في ذلك أساليب غير الخطية قوية مثل آلات ناقلات الدعم للانحدار وأشجار نموذج (أشجار القرار مع وظائف الانحدار الخطي في الأوراق) . وغالبا ما يكون هذا النهج لتحليل السلاسل الزمنية والتنبؤ أكثر قوة وأكثر مرونة من التقنيات الإحصائية الكلاسيكية مثل أرما و أريما. تتوفر بيئة النمذجة السلسة الزمنية الأساسية المذكورة أعلاه كبرامج مجانية مفتوحة المصدر في إصدار سي من ويكا. كما تم ملفوفة نفس الوظيفة في البرنامج المساعد منظور ملعقة التي تسمح للمستخدمين بنتاهو تكامل البيانات (بدي) للعمل مع تحليل سلسلة زمنية داخل ملعقة بدي واجهة المستخدم الرسومية. هناك أيضا خطوة المساعد ل بدي التي تسمح النماذج التي تم تصديرها من بيئة النمذجة سلسلة زمنية ليتم تحميلها واستخدامها لجعل التوقعات المستقبلية كجزء من التحول إيتل. المنظور و الخطوة الإضافات ل بدي هي جزء من الطبعة المؤسسة. 2 المتطلبات تتطلب بيئة نمذجة السلاسل الزمنية من ويكا ويكا غ 3.7.3 ويتم توفيرها كحزمة يمكن تثبيتها عبر مدير الحزمة. 3 استخدام بيئة سلسلة الوقت بمجرد تثبيتها عبر مدير الحزمة، يمكن العثور على بيئة النمذجة سلسلة زمنية في علامة تبويب جديدة في ويك إكسبلورر واجهة المستخدم الرسومية. يتم جلب البيانات في البيئة بالطريقة العادية عن طريق التحميل من ملف، ورل أو قاعدة بيانات عبر لوحة بريبروسيس من المستكشف. البيئة لديها خيارات التكوين الأساسية والمتقدمة. وهذا ما تم شرحه في الفقرات التالية. 3.1 التهيئة الأساسية في هذا المثال، تم تحميل مجموعة بيانات مجموعة البيانات (المضمنة في الحزمة) في المستكشف. هذه البيانات هي مجموعة بيانات مرجعية متاحة للجمهور تحتوي على سلسلة واحدة من البيانات: أرقام الركاب الشهرية لشركة الطيران للسنوات 1949 - 1960. وبصرف النظر عن أعداد الركاب، وتشمل البيانات أيضا طابع التاريخ التاريخ. تقوم لوحة التهيئة الأساسية تلقائيا بتحديد سلسلة الهدف المفرد وحقل التاريخ الزمني. في القسم معلمات واجهة المستخدم الرسومية (أعلى الجانب الأيمن)، يمكن للمستخدم إدخال عدد من الخطوات الزمنية للتنبؤ بعد نهاية البيانات الموردة. أسفل المربع المنسدل ختم الوقت، هناك مربع منسدل لتحديد دورية البيانات. إذا كانت البيانات لها طابع زمني، والطابع الزمني هو التاريخ، ثم يمكن للنظام تلقائيا الكشف عن دورية البيانات. وفيما يلي مربعات الاختيار التي تتيح للمستخدم اختيار أن يقوم النظام بحساب فترات الثقة لتنبؤاته وإجراء تقييم للأداء على بيانات التدريب. ويرد مزيد من التفاصيل عن جميع هذه الخيارات في أقسام لاحقة. 3.1.1 اختيار الهدف في الجزء العلوي الأيسر من لوحة التكوين الأساسية هي منطقة تسمح للمستخدم بتحديد الحقل (الحقول) المستهدف في البيانات التي يرغب في التنبؤ بها. ویمکن للنظام أن یشکل معا عدة حقول مستھدفة في وقت واحد من أجل التقاط التبعیات بینھا. وبسبب هذا، والنمذجة عدة سلسلة في وقت واحد يمكن أن تعطي نتائج مختلفة لكل سلسلة من النمذجة لهم بشكل فردي. عندما يكون هناك هدف واحد فقط في البيانات ثم النظام يختار تلقائيا. في حالة وجود أهداف متعددة محتملة يجب على المستخدم تحديدها يدويا. تظهر لقطة الشاشة أدناه بعض النتائج على مجموعة بيانات قياسية أخرى. في هذه الحالة البيانات هي المبيعات الشهرية (باللترات شهريا) من النبيذ الأسترالي. هناك ست فئات من النبيذ في البيانات، وسجلت المبيعات على أساس شهري من بداية عام 1980 حتى منتصف عام 1995. وقد وضعت على غرار سلسلة من السلاسل في وقت واحد: المحصنة والجافة والأبيض. 2.1.3 البارامترات الأساسية في الجزء العلوي الأيسر من لوحة التشكيل الأساسية هي منطقة تحتوي على عدة معلمات بسيطة تتحكم في سلوك خوارزمية التنبؤ. عدد وحدات الوقت الأول، والأهم من ذلك، هو عدد وحدات الوقت للتنبؤ مربع النص. هذا يسيطر على عدد الخطوات الزمنية في المستقبل سوف المتنبأ تنتج التنبؤات ل. يتم تعيين الإعداد الافتراضي على 1، أي أن النظام سيؤدي إلى توقع واحد من خطوة واحدة. بالنسبة لبيانات شركة الطيران قمنا بتعيين هذا إلى 24 (لجعل التوقعات الشهرية في المستقبل لمدة سنتين) وبالنسبة للبيانات النبيذ وضعناها إلى 12 (لجعل التوقعات الشهرية في المستقبل لمدة سنة واحدة). الوحدات تتوافق مع دورية البيانات (إذا كان معروفا). على سبيل المثال، مع البيانات المسجلة على أساس يومي وحدات الوقت هي أيام. الطابع الزمني التالي هو المربع المنسدل ختم الوقت. وهذا يسمح للمستخدم لتحديد أي، إن وجدت، الحقل في البيانات يحمل الطابع الزمني. إذا كان هناك حقل تاريخ في البيانات ثم يقوم النظام بتحديد هذا تلقائيا. إذا لم يكن هناك تاريخ موجود في البيانات ثم يتم تحديد الخيار فهرسة الوقت الاصطناعي تلقائيا. يمكن للمستخدم تحديد الطابع الزمني يدويا وسوف تحتاج إلى القيام بذلك إذا كان الطابع الزمني حقل رقمي غير تاريخ (لأن النظام لا يمكن تمييز هذا من حقل الهدف المحتمل). لدى المستخدم أيضا خيار اختيار لتونيغت من المربع المنسدل من أجل إخبار النظام بأنه لن يتم استخدام أي طابع زمني (اصطناعي أو غير ذلك). بيريوديسيتي تحت المربع المنسدل ختم الوقت هو مربع المنسدلة التي تسمح للمستخدم لتحديد بيريوديسيتي البيانات. إذا تم اختيار حقل التاريخ كطابع زمني، ثم يمكن للنظام استخدام الاستدلال تلقائيا للكشف عن دورية - لتيتكت تلقائيا سيتم تعيين ك الافتراضي إذا كان النظام قد وجدت وتعيين سمة التاريخ كختم الوقت في البداية. إذا كان الطابع الزمني ليس تاريخا، ثم يمكن للمستخدم معرفة النظام بشكل واضح ما هي دورية أو حدد لتوننغت إذا كان غير معروف. يتم استخدام دورية لتحديد القيم الافتراضية المعقولة لإنشاء المتغيرات المتخلفة (المذكورة أدناه في قسم التكوين المتقدم). في الحالة التي يكون فيها الطابع الزمني هو تاريخ، يتم استخدام دورية أيضا لإنشاء مجموعة افتراضية من الحقول المشتقة من التاريخ. مثلا وذلك بشكل دوري شهريا، شهر من السنة وحقول الربع يتم إنشاؤها تلقائيا. تحت المربع المنسدل الدوري هو حقل يسمح للمستخدم بتحديد الفترات الزمنية التي لا ينبغي اعتبارها زيادة الطابع الزمني فيما يتعلق بعملية النمذجة والتنبؤ والتصور. على سبيل المثال، النظر في بيانات التداول اليومية لسهم معين. يتم إغلاق السوق للتداول خلال عطلة نهاية الأسبوع وفي أيام العطل الرسمية، وبالتالي فإن هذه الفترات الزمنية لا تعتبر زيادة والفرق، على سبيل المثال، بين إغلاق السوق يوم الجمعة، وفي يوم الاثنين التالي هو وحدة مرة واحدة (وليس ثلاثة). إن الاستدلال المستخدم في الكشف عن التكرار الدوري غير قادر على التعامل مع هذه الثقوب في البيانات، لذلك يجب على المستخدم تحديد دورية لاستخدام وتوريد الفترات الزمنية التي لا تعتبر زيادات في حقل النص تخطي القائمة. يمكن أن يقبل حقل قائمة التخطيطات سلاسل مثل تواريخ عطلة نهاية الأسبوع وجلسة و الثلاثاء و آذار و أكتوبر و تواريخ محددة (مع سلسلة تنسيق اختيارية) مثل 2018-07-04yyyy-مم-د، والأعداد الصحيحة (التي تحصل على تفسير مختلف اعتمادا على المحدد دورية). وبالنسبة للبيانات اليومية، يفسر عدد صحيح على أنه اليوم من السنة بالنسبة إلى البيانات كل ساعة هو ساعة اليوم وللبيانات الشهرية هو شهر السنة. في تواريخ محددة، يحتوي النظام على سلسلة تنسيق افتراضية (يي-مم-دثه: مم: سس) أو يمكن للمستخدم تحديد واحد لاستخدامها عن طريق لاحقة التاريخ مع لتفورماتغت. إذا كانت جميع التواريخ في القائمة لها نفس التنسيق، فإنه يجب تحديدها مرة واحدة فقط (بالنسبة إلى التاريخ الأول الموجود في القائمة)، ثم سيصبح هذا التنسيق الافتراضي للتواريخ اللاحقة في القائمة. تظهر لقطات الشاشة التالية مثالا لبيانات appleStocks2018 (وجدت في دليل البيانات عينة من الحزمة). يحتوي هذا الملف على بيانات يومية عالية ومنخفضة وفتح وإغلاق لأسهم الكمبيوتر أبل من 3 يناير إلى 10 أغسطس 2018. وكانت البيانات تأخذ من التمويل ياهو (finance. yahooqhpsAAPLampa00ampb3ampc2018ampd07ampe10ampf2018ampgd). وقد تم تحديد توقعات لمدة خمسة أيام لقيمة الإغلاق اليومية، والحد الأقصى للفارق من 10 تكوين (انظر إنشاء لاج في القسم 3.2)، وتعيين دورية إلى اليومية وما يلي تخطي قائمة إدخالات المقدمة من أجل تغطية عطلة نهاية الأسبوع والعطلات الرسمية: عطلة نهاية الأسبوع، 2018-01-17yyyy-مم-د، 2018-02-21، 2018-04-22، 2018-05-30، 2018-07-04 لاحظ أنه من المهم إدخال تواريخ العطل الرسمية (وأي تواريخ أخرى لا تحسب كزيادات) التي ستحدث خلال الفترة الزمنية المستقبلية التي يتم التنبؤ بها. فترات الثقة أسفل المربع الزمني المنسدل ختم هو مربع الاختيار والحقل النص الذي يمكن للمستخدم اختيار أن يكون النظام حساب حدود الثقة على التنبؤات التي يجعلها. مستوى الثقة الافتراضي هو 95. يستخدم النظام التنبؤات التي تم إجراؤها للقيم المستهدفة المعروفة في بيانات التدريب لتعيين حدود الثقة. لذا، فإن مستوى الثقة 95 يعني أن 95 من القيم المستهدفة الحقيقية تندرج ضمن الفاصل الزمني. لاحظ أنه يتم حساب فترات الثقة لكل مستوى خطوة إلى الأمام بشكل مستقل، أي أن جميع التنبؤات خطوة واحدة إلى الأمام على بيانات التدريب تستخدم لحساب فترة الثقة من خطوة واحدة إلى الأمام، وجميع التنبؤات من خطوتين إلى الأمام هي تستخدم لحساب الفاصل الزمني من خطوتين إلى الأمام، وهلم جرا. إجراء التقییم افتراضیا، یتم إعداد النظام لتعلم نموذج التنبؤات وتولید توقعات بعد نھایة بیانات التدریب. يؤدي تحديد خانة الاختيار تقييم الأداء إلى إخطار النظام بإجراء تقييم للمتتبع باستخدام بيانات التدريب. وبمجرد أن يتم تدريب المتنبأ على البيانات، يتم تطبيقه بعد ذلك لوضع توقعات في كل نقطة زمنية (بالترتيب) من خلال تخطي البيانات. يتم جمع هذه التوقعات وتلخيصها باستخدام مقاييس مختلفة لكل خطوة زمنية مستقبلية متوقعة، أي أنه يتم جمع كل التوقعات المتوقعة من خطوة واحدة وتلخيصها، ويتم جمع وتلخيص جميع التنبؤات من خطوتين، وما إلى ذلك. وهذا يسمح للمستخدم أن يرى، إلى حد ما، كيف تنبؤات أخرى في الوقت المناسب مقارنة تلك أقرب في الوقت المناسب. تتيح لوحة التهيئة المتقدمة للمستخدم ضبط التشكيل من خلال تحديد المقاييس التي سيتم حسابها وما إذا كان سيتم الاحتفاظ ببعض البيانات من نهاية بيانات التدريب كمجموعة اختبار منفصلة. يظهر في الصورة التالية التقييم الافتراضي على بيانات التدريب النبيذ الأسترالي للأهداف المحصنة والجافة والأبيض. 3.1.3 المخرجات یتضمن الإخراج الناتج عن الإعدادات المتاحة من لوحة التکوین الأساسیة تقییم التدریب (المبین في الصورة السابقة)، والرسوم البیانیة للقیم المتوقعة بعد نھایة بیانات التدریب (کما ھو مبین في القسم 3.1) والقیم المتوقعة في استمارة نص ووصف نصي للنموذج المستخلص. هناك المزيد من خيارات الإخراج المتاحة في لوحة التكوين المتقدمة (التي نوقشت في القسم التالي). تظهر الصورة التالية نموذج تعلمت على بيانات شركة الطيران. افتراضيا، يتم تكوين بيئة تسلسل الوقت لمعرفة نموذج خطي، أي جهاز متجه الدعم الخطي ليكون دقيقا. السيطرة الكاملة على النموذج الأساسي المستفادة ومعلماته هو متاح في لوحة التكوين المتقدمة. يتم حفظ نتائج تحليل السلاسل الزمنية في قائمة النتائج في الجانب السفلي الأيسر من الشاشة. يتم إنشاء إدخال في هذه القائمة في كل مرة يتم تشغيل تحليل التنبؤ عن طريق الضغط على زر ابدأ. يتم تخزين جميع النواتج النصية والرسوم البيانية المرتبطة بتحليل تشغيل مع دخول كل منها في القائمة. المخزنة أيضا في القائمة هو نموذج التنبؤ نفسه. يمكن تصدير النموذج إلى القرص عن طريق تحديد حفظ نموذج التنبؤ من قائمة منبثقة السياقية التي تظهر عند النقر بزر الماوس الأيمن على إدخال في القائمة. من المهم أن ندرك أنه عند حفظ النموذج، فإن النموذج الذي يتم حفظه هو النموذج الذي يتم بناؤه على بيانات التدريب المقابلة لذلك الإدخال في قائمة التاريخ. عند إجراء تقييم حيث يتم االحتفاظ ببعض البيانات كمجموعة اختبار منفصلة) انظر أدناه في القسم 3.2 (، فإن النموذج المحفوظ تم تدريبه فقط على جزء من البيانات المتوفرة. من المفيد إيقاف التقييم المتراكم وبناء نموذج على جميع البيانات المتاحة قبل حفظ النموذج. 3.2 التهيئة المتقدمة توفر لوحة التهيئة المتقدمة التحكم الكامل للمستخدم في عدد من جوانب تحليل التنبؤات. وتشمل هذه الخيارات اختيار النموذج الأساسي والمعلمات، وخلق متغيرات متأخرة، وخلق متغيرات مستمدة من طابع زمني للتاريخ، ومواصفات بيانات التراكب، وخيارات التقييم، والتحكم في إنتاج المخرجات. ولكل منها لوحة فرعية مخصصة في التهيئة المتقدمة، وتناقش في الأقسام التالية. 3.2.1 المتعلم الأساسي توفر لوحة المتعلم الأساسي التحكم في خوارزمية التعلم ويكا التي تستخدم لنمذجة السلاسل الزمنية. كما يسمح للمستخدم لتكوين المعلمات محددة لخوارزمية التعلم المحدد. افتراضيا، يتم تكوين بيئة التحليل لاستخدام جهاز متجه الدعم الخطي للتراجع (ويكاس سموريغ). ويمكن بسهولة تغيير هذا عن طريق الضغط على زر اختيار واختيار خوارزمية أخرى قادرة على التنبؤ بكمية رقمية. ضبط المعلمات الفردية للخوارزمية التعلم المحدد يمكن أن يتحقق عن طريق النقر على لوحة الخيارات. وجدت على الفور إلى يمين الزر اختيار. القيام بذلك يجلب حوار خيارات لخوارزمية التعلم. 3.2.2 إنشاء الإغراق تتيح لوحة إنشاء الإغراق للمستخدم التحكم والتحكم في كيفية إنشاء المتغيرات المتأخرة. المتغیرات المتغیرة ھي الآلیة الرئیسیة التي یمکن من خلالھا تحدید العلاقة بین القیم السابقة والحالیة لسلسلة من خوارزمیات التعلم المقترحة. أنها تخلق نافذة أو لقطة على مدى فترة زمنية. وبشكل أساسي، يحدد عدد المتغيرات المتأخرة التي تم إنشاؤها حجم النافذة. تستخدم لوحة التهيئة الأساسية إعداد بيريوديسيتي لتعيين قيم افتراضية معقولة لعدد المتغيرات المتأخرة (وبالتالي حجم الإطار) التي تم إنشاؤها. على سبيل المثال، إذا كانت لديك بيانات مبيعات شهرية، فبما في ذلك تأخر ما يصل إلى 12 خطوة زمنية في الماضي سيكون منطقيا بالنسبة إلى بيانات كل ساعة، قد تحتاج إلى فترات زمنية تصل إلى 24 خطوة زمنية أو ربما 12. الجانب الأيمن من لوحة الإنشاء المتأخرة لديها منطقة تسمى طول التأخر الذي يحتوي على ضوابط لإعداد وضبط أطوال تأخر. في الجزء العلوي من هذه المنطقة هناك خانة الاختيار ضبط التباين الذي يسمح للمستخدم لاختيار أن يكون النظام تعويض عن التباين في البيانات. وهو يفعل ذلك عن طريق أخذ سجل كل هدف قبل إنشاء المتغيرات المتخلفة وبناء النموذج. ويمكن أن يكون ذلك مفيدا إذا زاد التباين (كم يقفز البيانات) أو ينخفض ​​على مر الزمن. قد يؤدي تعديل التباين، أو قد لا يؤدي، إلى تحسين الأداء. فمن الأفضل لتجربة ومعرفة ما إذا كان يساعد على تركيبة اختيار داتاباراميتر في متناول اليد. أسفل خانة الاختيار ضبط التباين خانة الاختيار استخدام طول تأخر مخصص. وهذا يسمح للمستخدم بتغيير أطوال التأخير الافتراضية التي يتم تعيينها بواسطة لوحة التكوين الأساسية. لاحظ أن الأرقام المعروضة للأطوال ليست بالضرورة القيم الافتراضية التي سيتم استخدامها. إذا كان المستخدم قد حدد لتيتكت تلقائيا في مربع التكرار المنسدلة على لوحة التكوين الأساسية ثم تعيين الافتراضي تأخر أطوال تعيين عندما يحصل على تحليل البيانات في وقت التشغيل. يسمح حقل نص الحد الأدنى للتخلف للمستخدم بتحديد الحد الأدنى للخطوة السابقة لإنشاء حقل متخلف عن - على سبيل المثال. تعني القيمة 1 أنه سيتم إنشاء متغير متخلف يحمل قيم الهدف في الوقت - 1. يحدد حقل النص الأقصى للتخلف الحد الأقصى للخطوة الزمنية السابقة لإنشاء متغير متخلف عن - على سبيل المثال. فإن قيمة 12 تعني أن متغيرا متخلفا سيجري إنشاء قيم مستهدفة في الوقت المناسب. 12 - وستتحول جميع الفترات الزمنية بين الفارق الأدنى والقصير إلى متغيرات متأخرة. فمن الممكن لضبط خلق المتغيرات ضمن الحد الأدنى والحد الأقصى عن طريق إدخال نطاق في حقل النص اختيار تأخر اللحن. في الصورة أدناه لدينا بيانات أسبوعية لذلك قد اختار تعيين الحد الأدنى والحد الأقصى للتخلف إلى 1 و 52 على التوالي. ضمن هذا اخترنا فقط إنشاء الفواصل 1-26 و 52. على الجانب الأيمن من لوحة خلق تأخر هو منطقة تسمى المتوسط. يؤدي تحديد خانة الاختيار متوسط ​​التأخر الطويل المتتابع إلى تقليل عدد المتغيرات المتخلفة عن طريق حساب متوسط ​​عدة متغيرات متتالية (في الوقت). هذا يمكن أن يكون مفيدا عندما تريد أن يكون نافذة واسعة على البيانات ولكن ربما لا يكون لديك الكثير من نقاط البيانات التاريخية. تنص القاعدة الأساسية على أنه يجب أن يكون لديك ما لا يقل عن 10 أضعاف عدد الصفوف كحقول (هناك استثناءات لهذا استنادا إلى خوارزمية التعلم - على سبيل المثال، يمكن أن تعمل آلات ناقل الدعم بشكل جيد جدا في الحالات التي توجد فيها العديد من الحقول أكثر من الصفوف). ويؤدي حساب عدد من المتغيرات المتخلفة المتتالية في حقل واحد إلى تقليل عدد حقول الإدخال مع احتمال فقدان المعلومات على الأرجح (لفترات زمنية طويلة على الأقل). ويسمح متوسط ​​التأخر أطول من حقل النص للمستخدم بتحديد متى تبدأ عملية حساب المتوسط. على سبيل المثال، في لقطة أعلاه يتم تعيين هذا إلى 2، وهذا يعني أن الوقت - 1 والوقت - سيتم ترك 2 المتغيرات المتخلفة لم يمسها في حين الوقت - سيتم استبدال 3 وأعلى مع المتوسطات. إن الفترات المتتالية ال 35 المتتالية لمتوسط ​​التحكم في عدد المتغيرات المتأخرة ستكون جزءا من كل مجموعة متوسطة. على سبيل المثال، في لقطة أعلاه يتم تعيين هذا أيضا إلى 2، وهذا يعني أن الوقت - 3 والوقت - 4 سيتم متوسطها لتشكيل الوقت حقل جديد - 5 والوقت - 6 سيتم متوسط ​​لتشكيل حقل جديد وهلم جرا. لاحظ أن المتغير المتخلف المتتابع فقط سيكون متوسطه، لذلك في المثال أعلاه، حيث قمنا بالفعل ضبط دقيق تأخر إنشاء عن طريق تحديد التأخر 1-26 و 52، الوقت - 26 لن يكون متوسطا مع الوقت - 52 لأنها ليست على التوالي. 3.2.3 السمات الدورية تتيح لوحة السمات الدورية للمستخدم تخصيص السمات الدورية المستمدة من التاريخ. لا تتوفر هذه الوظيفة إلا إذا كانت البيانات تحتوي على طابع زمني للتاريخ. إذا كان الطابع الزمني هو تاريخ، يتم تعيين إعدادات افتراضية معينة (كما يحددها إعداد الدوريات من لوحة التكوين الأساسية) تلقائيا. على سبيل المثال، إذا كانت البيانات تحتوي على فاصل زمني شهري ثم يتم تضمين شهر السنة والربع تلقائيا كمتغيرات في البيانات. يمكن للمستخدم تحديد مربع الاختيار تخصيص في منطقة إنشاء الدوري المستمدة من تاريخ لتعطيل واختيار وإنشاء متغيرات جديدة المستمدة التاريخ المستمدة. عند تحديد مربع الاختيار يتم عرض المستخدم مع مجموعة من المتغيرات المحددة مسبقا كما هو مبين في الصورة التالية: ترك كافة المتغيرات الافتراضية غير المحددة سيؤدي إلى عدم إنشاء المتغيرات المشتقة من التاريخ. وبصرف النظر عن الافتراضات المحددة مسبقا، فمن الممكن لخلق المتغيرات المستمدة التاريخ المستمدة. يمكن إنشاء متغير مشتق تاريخ مخصص جديد، استنادا إلى قاعدة، عن طريق الضغط على زر جديد. هذا يبرز محرر كما هو مبين أدناه: في هذا المثال، أنشأنا متغير مشتق من التاريخ المخصص يسمى تشيستمسبرياك الذي يتضمن اختبار واحد على أساس التاريخ (هو مبين في منطقة القائمة في الجزء السفلي من الحوار). هذا المتغير هو منطقي وسيتخذ القيمة 1 عندما يكون التاريخ بين 24 ديسمبر و 2 يناير شاملة. ويمكن إضافة اختبارات إضافية للسماح للقاعدة أن تقيم إلى صحيح لفترات متقطعة في الوقت المناسب. يسمح حقل نص اسم الحقل للمستخدم بإعطاء المتغير الجديد اسما. في ما يلي زران. يضيف الزر الجديد اختبارا جديدا للقاعدة ويحذف الزر حذف الاختبار المحدد حاليا من القائمة في الأسفل. يؤدي تحديد اختبار في القائمة إلى نسخ قيمها إلى المربعات المنسدلة للحدود العليا والسفلى للاختبار، كما هو موضح في منطقة الفاصل الزمني للاختبار في لقطة الشاشة أعلاه. يقوم كل مربع من القائمة المنسدلة بتعديل عنصر واحد من عنصر محدد. هم (من اليسار إلى اليمين): عامل المقارنة، السنة، الشهر من السنة، أسبوع من السنة، أسبوع من الشهر، يوم من أيام السنة، يوم من الشهر، يوم من أيام الأسبوع، ساعة من اليوم، دقيقة من الساعة والثانية. تظهر نصائح الأدوات التي تعطي وظيفة كل منها عندما يحوم الماوس فوق كل مربع من القائمة المنسدلة. يحتوي كل مربع منسدل على القيم القانونية لهذا العنصر من الحدود. أحرف أستريكس () هي أحرف البدل وتطابق أي شيء. أسفل منطقة فترة الاختبار هو حقل نص تسمية. يسمح هذا بتسمية سلسلة مع كل فاصل زمني اختبار في قاعدة. يجب أن يكون لكل الفواصل في قاعدة تسمية، أو لا شيء منها. وجود بعض الفواصل مع تسمية وبعض دون سوف تولد خطأ. إذا كان كل الفواصل لها تسمية، ثم سيتم استخدامها لتعيين قيمة الحقل المخصص المقترن مع القاعدة بدلا من مجرد 0 أو 1. تقييم القاعدة يتابع كقائمة، أي من أعلى إلى أسفل، والفترة الأولى التي يتم تقييمها إلى ترو هي التي يتم استخدامها لتعيين قيمة الحقل. يمكن إعداد تسمية افتراضية (أي التسمية التي يتم تعيينها في حالة عدم وجود فترات اختبار أخرى) باستخدام جميع أحرف البدل لفترة الاختبار الأخيرة في القائمة. في الحالة التي يكون فيها كل الفواصل تسميات، وإذا لم يكن هناك إعداد افتراضي للاكتشاف، فسيتم تعيين قيمة الحقل المخصص على المفقودين في حال عدم تطابق الفاصل الزمني. وهذا يختلف عن الحالة التي لا يتم فيها استخدام العلامات والمجال هو علم ثنائي - في هذه الحالة، فإن الفشل في مطابقة النتائج الفاصلة في قيمة الحقل المخصص الذي يتم تعيينه إلى 0. 3.2.4 بيانات التراكب بيانات التراكب لوحة تتيح للمستخدم تحديد الحقول (إن وجدت) التي ينبغي اعتبارها بيانات تراكب. الافتراضي هو عدم استخدام بيانات التراكب. وبحسب بيانات التراكب، فإننا نعني حقول الإدخال التي يجب اعتبارها خارجية لعمليات تحويل البيانات وعمليات التنبؤ في الحلقة المغلقة. أي أن البيانات التي لا يمكن التنبؤ بها، لا يمكن استخلاصها تلقائيا وسيتم توفيرها للفترات الزمنية المستقبلية التي يمكن التنبؤ بها. في الصورة أدناه، تم تحميل بيانات النبيذ الأسترالية في النظام وتم اختيارها محصنة كهدف للتنبؤ. عن طريق تحديد مربع الاختيار استخدام تراكب البيانات، يعرض النظام الحقول المتبقية في البيانات التي لم يتم تحديدها إما استهدافا أو الطابع الزمني. تتوفر هذه الحقول لاستخدامها كبيانات تراكب. وسيستخدم النظام حقول تراكب مختارة كمدخلات للنموذج. وبهذه الطريقة يمكن أن يأخذ النموذج في الاعتبار الظروف التاريخية الخاصة (مثل انهيار سوق الأوراق المالية) وعامل الظروف التي ستحدث في نقاط معروفة في المستقبل (على سبيل المثال الترقيات المبيعات غير النظامية التي حدثت تاريخيا، ومن المخطط لها في المستقبل ). وغالبا ما يشار إلى هذه المتغيرات باسم متغيرات التدخل في الأدب السلاسل الزمنية. عند تنفيذ تحليل يستخدم بيانات التراكب، قد يبلغ النظام أنه غير قادر على توليد توقعات تتجاوز نهاية البيانات. وذلك لأننا لا نملك قيم حقول التراكب للفترات الزمنية المطلوبة، وبالتالي فإن النموذج غير قادر على توليد توقعات للهدف المحدد (الأهداف) المحددة. وتجدر الإشارة إلى أنه من الممكن تقييم النموذج الخاص ببيانات التدريب والبيانات التي تم الاحتفاظ بها من نهاية بيانات التدريب لأن هذه البيانات لا تحتوي على قيم لحقول التراكب. ويرد المزيد من المعلومات عن صنع التنبؤات التي تنطوي على بيانات تراكب في الوثائق المتعلقة خطوة المساعد التنبؤات ل بينتاهو تكامل البيانات. 3.2.5 التقييم تسمح لوحة التقييم للمستخدم بتحديد مقاييس التقييم التي يرغبون في رؤيتها، وتهيئة ما إذا كان سيتم تقييمهم باستخدام بيانات التدريب أو مجموعة من البيانات التي تم الحصول عليها من نهاية بيانات التدريب. اختيار إجراء تقييم في لوحة التكوين الأساسية ما يعادل اختيار تقييم على التدريب هنا. وتحسب افتراضيا متوسط ​​الخطأ المطلق (مي) وخطأ متوسط ​​الجذر (رمز) للتنبؤات. يمكن للمستخدم تحديد المقاييس التي يجب حسابها في منطقة المقاييس في الجانب الأيمن من اللوحة. المقاييس المتاحة هي: متوسط ​​الخطأ المطلق (مي): المجموع (عبس (متوقع - فعلي)) N متوسط ​​الخطأ التربيعي (مس): سوم ((متوقع - فعلي) 2) N خطأ متوسط ​​التربيع الجذر (رمز): سرت () متوقع (- الفعلي (2 (N) متوسط ​​الخطأ النسبي المطلق (ماب): المجموع (عبس) (متوقع - فعلي) الفعلي)) N دقة الاتجاه (داك): علامة (إشارة فعلية - فعلية) )) N الخطأ النسبي المطلق (راي): سوم (القيمة المطلقة (المتوقعة - الفعلية)) سوم (القيمة المطلقة (بريفيوستارجيت - الفعلي)) الخطأ التربيعي الجذر النسبي (رسي): سرت (سوم) (المتوقع - الفعلي) 2) (سوم (بريوفيستارجيت - أكتوال) 2) N) تعطي المقاييس النسبية مؤشرا لكيفية أداء التنبؤات الخاصة بالمتنبئين جيدا مقارنة باستخدام آخر قيمة مستهدفة معروفة مثل التنبؤ. ويعبر عنها كنسبة مئوية، وتشير القيم الأدنى إلى أن القيم المتوقعة هي تنبؤات أفضل من مجرد استخدام آخر قيمة مستهدفة معروفة. وتشير درجة من GT100 إلى أن المتنبأ يفعل أي أفضل (أو أسوأ من ذلك) من التنبؤ آخر قيمة الهدف المعروفة. لاحظ أن آخر قيمة مستهدفة معروفة هي نسبة إلى الخطوة التي يتم فيها تنفيذ التوقعات - على سبيل المثال. يتم مقارنة التنبؤ 12 خطوة قبل نسبة إلى استخدام القيمة المستهدفة 12 خطوات الوقت قبل التنبؤ (لأن هذا هو آخر قيمة الهدف الفعلي المعروفة). حقل النص إلى يمين تقييم على عقد التدريب خانة الاختيار يسمح للمستخدم لتحديد كم من البيانات التدريب للخروج من نهاية سلسلة من أجل تشكيل مجموعة اختبار مستقلة. الرقم الذي تم إدخاله هنا يمكن أن يشير إلى عدد مطلق من الصفوف، أو يمكن أن يكون جزءا صغيرا من بيانات التدريب (معبرا عنه برقم بين 0 و 1). 3.2.6 المخرجات توفر لوحة أوتبوت الخیارات التي تتحکم في الإخراج النصي والرسمي الذي ینتجھ النظام. يتم تقسيم اللوحة إلى قسمين: خيارات الإخراج وخيارات الرسوم البيانية. يتحكم الأول في ما يظهر الناتج النصي في منطقة المخرجات الرئيسية للبيئة، في حين أن الأخير يتحكم في الرسوم البيانية التي يتم إنشاؤها. في منطقة الإخراج من لوحة، واختيار التنبؤات الإخراج في الخطوة يسبب النظام لإخراج القيم الفعلية والمتوقعة لهدف واحد في خطوة واحدة. الخطأ هو أيضا الإخراج. على سبيل المثال، يتم عرض التوقعات من 5 خطوات إلى الأمام على اختبار اختبار التدريجي للهدف المحصن في بيانات النبيذ الأسترالية في الصورة التالية. اختيار الإخراج التنبؤات المستقبلية بعد نهاية السلسلة سوف يسبب النظام لإخراج بيانات التدريب والقيم المتوقعة (تصل إلى الحد الأقصى لعدد وحدات الوقت) بعد نهاية البيانات لجميع الأهداف التي توقعها المتنبأ. وتتميز القيم المتوقعة بما يجعل الحدود بين قيم التدريب والقيم المتوقعة واضحة. في منطقة خيارات الرسوم البيانية للوحة يمكن للمستخدم تحديد الرسوم البيانية التي يتم إنشاؤها بواسطة النظام. وعلى غرار المخرجات النصية، يمكن التنبؤ بالتنبؤات في خطوة معينة من خلال تحديد خانة الاختيار تنبؤات الرسم البياني في الخطوة. وخلافا للنواتج النصية، فإن جميع الأهداف التي يتوقعها المتنبأ سوف تكون بيانية. يتيح تحديد مربع الاختيار "استهداف الرسم البياني في الخطوات" تحديد هدف واحد في الرسم البياني بأكثر من خطوة - على سبيل المثال. يمكن إنشاء الرسم البياني الذي يظهر خطوة واحدة إلى الأمام، 2-خطوة إلى الأمام والتنبؤات 5 خطوات إلى الأمام لنفس الهدف. يصبح الهدف إلى المربع المنسدل للرسم البياني وحقل النص إلى خطوات الرسم البياني نشطا عند تحديد مربع الاختيار استهداف الرسم البياني عند الخطوات. تظهر الصورة التالية الرسوم البيانية الهدف فورتيفيد من البيانات النبيذ الاسترالية على مجموعة من التدريجي في الخطوات 1،2،3،6 و 12. 4 باستخدام أبي هنا مثال يوضح كيفية بناء نموذج التنبؤ وجعل توقعات منتظمة. يمكن العثور على جافادوك لحزمة التنبؤ سلسلة زمنية في weka. sourceforgedoc. packagestimeseriesForecasting 5 تحليل سلسلة الوقت بدي ملعقة المساعد ويمكن أيضا أن تستخدم بيئة تحليل سلسلة الوقت الموصوفة في الأقسام السابقة ضمن التكامل بينتاهو البيانات ملعقة واجهة المستخدم. يظهر كمنظور داخل ملعقة ويعمل بنفس الطريقة تماما كما هو موضح أعلاه. The only difference is in how data is brought into the time series environment. When running inside of Spoon, data can be sent to the time series environment via a Table Input or Table Output step. Right-clicking on either of these steps brings up a contextual menu selecting Forecast from this menu activates the time series Spoon perspective and loads data from the data base table configured in the Table InputOutput step into the time series environment.

No comments:

Post a Comment