OpenAI kynnir aðferð til að spá fyrir um hegðun gervigreindar fyrir útgáfu

15 sources
  • OpenAI kynnti "Deployment Simulation", sem fjarlægir svör gervigreindar úr fyrri samtölum og lætur ný líkön endurskapa þau til að flagga óöruggri hegðun fyrir útgáfu.
  • Aðferðin var staðfest á GPT-5 líkanaröðinni og spáði nákvæmlega fyrir um stefnubreytingar í 20 tegundum óæskilegrar hegðunar með 1,5x miðgildi villu.
  • Nálgunin miðar að því að vinna gegn aukinni getu líkana til að greina hvenær þau eru metin, sem er áhyggjuefni sem dregið er fram í alþjóðlegu skýrslunni um öryggi gervigreindar 2026.
Sources (15)
  1. 1 Predicting model behavior before release by simulating ... openai.com
  2. 2 OpenAI Simulates AI Deployments www.startuphub.ai
  3. 3 International AI Safety Report 2026 internationalaisafetyreport.org
  4. 4 It Begins: OpenAI's o3 Hacked The Clock To Pass Its Safety Test www.youtube.com
  5. 5 Strengthening societal resilience with Rosalind Biodefense openai.com
  6. 6 2026 Alert: The Hidden Risk in AI Safety Testing podcasts.apple.com
  7. 7 OpenAI has successfully developed a method to test AI ... gigazine.net
  8. 8 OpenAIが「AIにバレずにAIをテストする手法」の開発に成功 (2026年6月17日掲載) - ライブドアニュース news.livedoor.com
  9. 9 OpenAI Is Simulating Millions of Real Conversations to ... www.reddit.com
  10. 10 OpenAI Deployment Safety Hub: System cards & other updates deploymentsafety.openai.com
  11. 11 What Is Iterative Deployment? OpenAI's Strategy for ... www.mindstudio.ai
  12. 12 OpenAI (@OpenAI) / Posts / X x.com
  13. 13 Azure OpenAI in der REST-API-Vorschaureferenz für ... learn.microsoft.com
  14. 14 Safety & responsibility | OpenAI openai.com
  15. 15 Pre-Deployment Evaluation of OpenAI's o1 Model | NIST www.nist.gov

Leave a Reply

Your email address will not be published. Required fields are marked *

Stay informed and not overwhelmed, subscribe now!