[QA] Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress? Arxiv Papers podcast

Artwork

Science Igor Melnyk

Konten disediakan oleh Igor Melnyk. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh Igor Melnyk atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.

Arxiv Papers « »
[QA] Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress?

3M ago 7:50

Bagikan

MP3•Beranda episode

Konten disediakan oleh Igor Melnyk. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh Igor Melnyk atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.

The paper analyzes AI safety benchmarks, revealing their correlation with general capabilities, and proposes a clearer framework for defining and measuring AI safety research goals.

https://arxiv.org/abs//2407.21792

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support

… continue reading

1619 episode

#Science #Igor Melnyk

Artwork

[QA] Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress?

published 3M ago

Bagikan

MP3•Beranda episode

Konten disediakan oleh Igor Melnyk. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh Igor Melnyk atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.

The paper analyzes AI safety benchmarks, revealing their correlation with general capabilities, and proposes a clearer framework for defining and measuring AI safety research goals.

https://arxiv.org/abs//2407.21792

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support

… continue reading

1619 episode

#Science #Igor Melnyk

Todos los episodios

×

Selamat datang di Player FM!

Player FM memindai web untuk mencari podcast berkualitas tinggi untuk Anda nikmati saat ini. Ini adalah aplikasi podcast terbaik dan bekerja untuk Android, iPhone, dan web. Daftar untuk menyinkronkan langganan di seluruh perangkat.

Dengarkan 500+ topik