低成本下載高質數據 網頁擷取技術 發掘投資機會
撰文:Smart ED編輯部|圖片:unsplash
非價格(Non-price)訊號及指標常常被炒家忽略,但其實當中蘊含著大量信息,有助用家建構出勝算高的策略。
不過,有些非價格數據,並不能輕易從網上的免費來源下載,而是需要付費,或是要用家不斷自行儲存。
經紀商提供數據通道
但真的能夠持之以恒,下載並妥善儲存,並不是一件容易的事;假若一次半次忘記下載,便會出現資料缺失的情況,難以做出完整的回溯測試。
而目前一般投資者可取得的便宜或免費數據來源,可以分為經紀商及網上兩類。
若經紀商容許用家作程式交易,便會提供數據通道讓用家接通,例如API、DDE、TCP等等不同類型的連接方法,炒家的程式便能收到即市數據進行炒賣。
因此,用家可以直接使用早幾期提及過的交易軟件,如Multicharts,或者在自家的程式中加入數行代碼(Code),把收到的即時數據儲存起來,當累積一定數量後,日後便能進行回測。
數據費用取決不同經紀商
有時候,經紀商更可讓客戶透過API拿取歷史數據,如此便不用漫長地等待數據儲存,亦能立即進行分析。
這個方法成本低廉,數據精度高達「Tick」水平,即市場上每一個成交價更新都能接收,基本上支付每月數據費用便能拿取。 至於數據費用,取決於不同經紀商,由數10元至100多元不等。
不過,大多數經紀商提供的都是價格數據,如開市價、最高價、最低價、收市價及成交量等數據,如想獲取非價格訊號及數據,便可考慮在網上拿取。
舉例,港交所(00388)每天會上載大量的交易數據,用家可以到網站下載每日市場報告,妥善儲起。當然,最方便的做法為編寫一個簡單程式,能夠自動到相關網站下載數據。
運用網頁擷取技術
以程式下載數據有著極大好處,因為股市上有眾多數據,若果單憑人手下載,恐怕每天都需要大費周張,浪費大量寶貴的時間。
交易者以交易為生,每天的精神時間都應該盡量花在策略分析上,所以凡是重複性高的工作,都應該盡量靠自動化的程式去取代,減少人手處理數據的時間。
因此,不少交易者早就自行編寫程式,運用網頁擷取技術(Web scraping),每日自動下載最新的期貨、期權數據,從期貨和期權合約的交易量、未平倉合約(Open interest)、引伸波幅(Implied volatility)等數據,發掘潛在的投資機會。