資訊考點新
第六集 - 數據清理的基本概念與技巧:處理缺失值、重複值、異常值等
數據清理(data cleaning)之基本概念:對數據進行審查、校驗與修正的過程,主要目的是刪除重複訊息、糾正錯誤(如不一致或不準確的數據)、處理缺失值、無效值及異常值,進而提升數據之品質。
正所謂:「garbage in,garbage out」,在數據科學領域中,當輸入的數據品質低劣(如:錯誤、雜亂),無論後續處理過程多麼嚴謹,輸出的結果仍將是不可靠的。
進行數據分析之前,應該要先通過數據清理,確保後續分析或模型建構的準確性,這是數據預處理(data preprocessing)的關鍵步驟。
- 考點
- #數據清理
- #數據集
演算法進階觀念:近似演算法(二)
上回說到,在演算法領域中,許多實務上經常遇到的問題屬於 NP-complete 或 NP-hard 類別,代表目前尚無已知能在多項式時間內找到最佳解的方法。儘管這些問題在理論上困難重重,現實中卻無法迴避,因此需要採取替代策略來解決他們。其中,近似演算法(Approximation Algorithms)是一種常見且實用的方法,目標是在合理的時間內產生接近最佳的可行解。我們也介紹了近似比率(approximation ratio)的概念,它用來衡量近似解的表現有多好,代表近似解與最佳解之間的差距。如果設計出的近似演算法,其近似解與最佳解的關係能達到某個近似比率(假設為α),則該近似演算法可以被稱作α-approximation algorithm。對於最小化問題,近似解通常大於最佳解,而最大化問題則相反。近似比率的數值永遠不小於 1,越接近 1 表示解越好。這些演算法常常在計算時間與解的精確度之間取得權衡,特別適合應用在資源有限或需要即時處理的情境中。
- 考點
- #近似演算法
- #集合覆蓋問題
- #NP-hard
人工智慧時代下的風險
隨著人工智慧技術的迅速發展與廣泛應用,AI逐漸成為現代社會中不可或缺的一環,相關AI應用亦深入至教育、醫療、金融、娛樂等各大領域。其中生成式AI尤其備受關注,透過文字、圖像、音樂甚至程式碼的自動生成,帶來前所未有的便利與創意可能性。然而資訊科技所帶來的便利性背後也伴隨著日益嚴峻的風險與挑戰。
AI系統本身可能產生偏見與錯誤資訊,進而對社會輿論、政治決策乃至公共安全造成影響,除此之外,隱私洩露、深偽技術(Deepfake)、假新聞自動生成等問題,也逐漸暴露出AI發展在道德、法律與安全層面的脆弱性。
- 題測
- According to the PwC Global Artificial Intelligence Study, AI is expected to contribute up to USD 15.7 trillion to the global economy by 2030. However, as AI systems become increasingly widespread, organizations face a range of risks when adopting them-including data bias, security vulnerabilities, and lack of transparency in decision-making. In high-stakes sectors such as finance, healthcare, and judiciary, AI risk management has become a critical aspect of corporate governance.
-
- Describe three major types of risks that organizations may encounter when deploying AI systems. Provide examples of how these risks could have real-world impacts on an organization. You may consider perspectives such as technical, legal, and ethical risks. (16 points)
- Analyze how organizations can develop an AI risk management framework to mitigate the risks mentioned above. Propose at least three concrete strategies or tools and explain their purposes and key implementation considerations. (16 points)