Η Google DeepMind προετοιμάζει ένα νέο πλαίσιο ασφαλείας για την περίπτωση όπου οι AI agents, δηλαδή τα συστήματα τεχνητής νοημοσύνης που μπορούν να εκτελούν αυτόνομα εργασίες, αποκτήσουν συμπεριφορές εκτός των ορίων που θέτουν οι οργανισμοί.
Η βασική παραδοχή είναι ότι η πλήρης «ευθυγράμμιση» της τεχνητής νοημοσύνης με τους στόχους και τις προθέσεις των ανθρώπων ενδέχεται να μην επιτευχθεί απόλυτα. Για τον λόγο αυτό, η DeepMind μεταφέρει μέρος της συζήτησης από την πρόληψη στην ανίχνευση και τον περιορισμό πιθανών περιστατικών.
Διαβάστε ακόμα: Στα 201,6 δισ. δολάρια η αγορά gaming το 2025
ΑΣΦΑΛΕΙΑ
Ο νέος οδικός χάρτης αντιμετωπίζει τους AI agents ως πιθανούς εσωτερικούς παράγοντες κινδύνου, με λογική αντίστοιχη των συστημάτων κυβερνοασφάλειας που χρησιμοποιούνται για υπαλλήλους ή συνεργάτες με πρόσβαση σε εταιρικά δίκτυα και δεδομένα.
Η διαφορά είναι η ταχύτητα και η κλίμακα. Ένας agent μπορεί να εκτελέσει μεγάλο αριθμό ενεργειών, να χρησιμοποιήσει πολλαπλά εργαλεία και να κινηθεί σε διαφορετικά πληροφοριακά συστήματα σε πολύ μικρό χρόνο. Αυτό αυξάνει την ανάγκη για συνεχή έλεγχο των δικαιωμάτων πρόσβασης και των ενεργειών που πραγματοποιεί.
ΠΡΟΣΒΑΣΗ
Η DeepMind θεωρεί ότι τα παραδοσιακά μοντέλα δικαιωμάτων, τα οποία συνδέουν την πρόσβαση με τον σταθερό ρόλο ενός εργαζομένου, μπορεί να μην επαρκούν για τους AI agents. Ένας agent ενδέχεται να εκτελεί καθήκοντα για περισσότερα από ένα τμήματα ή να συμμετέχει σε πλήρως αυτοματοποιημένες διαδικασίες χωρίς σαφή αντιστοίχιση με έναν μόνο ανθρώπινο χρήστη.
Η κατεύθυνση που προτείνεται είναι η δυναμική διαχείριση πρόσβασης. Με απλά λόγια, ο agent θα πρέπει να αποκτά πρόσβαση μόνο στα δεδομένα και τα εργαλεία που απαιτούνται για τη συγκεκριμένη εργασία που εκτελεί εκείνη τη στιγμή. Η πρόσβαση αυτή θα μπορεί να ανακαλείται άμεσα όταν αλλάζει η διαδικασία ή εμφανίζονται ενδείξεις απόκλισης.
ΠΑΡΑΚΟΛΟΥΘΗΣΗ
Στο πλαίσιο αυτό, η εταιρεία αναφέρει ότι έχει ήδη αναπτύξει εσωτερικό πρωτότυπο για την παρακολούθηση ενεργειών agents κώδικα. Το σύστημα εξετάζει τις διαδρομές ενεργειών τους, εντοπίζει ασυνήθιστα μοτίβα και προωθεί τα ευρήματα για ανθρώπινο έλεγχο.
Σύμφωνα με τη DeepMind, έχουν αναλυθεί περίπου 1 εκατ. εργασίες agents κώδικα. Η εμπειρία αυτή αξιοποιήθηκε για μηχανισμό ζωντανής παρακολούθησης του Gemini Spark, με στόχο την άμεση αντίδραση ακόμη και σε ακούσια περιστατικά, όπως η διαγραφή δεδομένων.
Η εταιρεία επισημαίνει ότι τα περισσότερα alerts δεν αφορούν κακόβουλη πρόθεση. Μπορεί να σχετίζονται με λανθασμένη ερμηνεία μιας εντολής ή με υπερβολική προσπάθεια του agent να πετύχει τον στόχο που του έχει δοθεί.
ΚΙΝΔΥΝΟΙ
Ο οδικός χάρτης περιλαμβάνει περίπου 15 κατηγορίες μηχανισμών άμυνας, από αρχεία δικτυακής δραστηριότητας έως τη χρήση άλλων μοντέλων για έλεγχο της συμπεριφοράς των agents. Παράλληλα, η DeepMind προτείνει το πλαίσιο TRAIT&R, με κατηγορίες κινδύνου όπως η απώλεια ελέγχου, η δολιοφθορά εργασιών και η άμεση βλάβη σε κρίσιμα δεδομένα ή περιουσιακά στοιχεία.
Για τις επιχειρήσεις, το μήνυμα είναι ότι η αξιοποίηση AI agents δεν περιορίζεται στην παραγωγικότητα. Προϋποθέτει νέους κανόνες πρόσβασης, καταγραφή ενεργειών, ανθρώπινη επίβλεψη και δυνατότητα άμεσης διακοπής μιας αυτοματοποιημένης διαδικασίας όταν εμφανίζονται αποκλίσεις.


