Masayoshi Son´s gewagte 100-Milliarden-Dollar-Mission
Eine bahnbrechende Investition in die Zukunft der KI: Masayoshi Son, der visionäre Gründer der SoftBank Group, plant, eine gewaltige Investition von 100 Milliarden Dollar in ein neues AI-Chip-Unternehmen namens Izanagi zu stecken. Ziel ist es, eine ernsthafte Konkurrenz für Branchengiganten wie Nvidia zu werden.
Warum ist das wichtig?
Innovationstreiber: Son ist bekannt für seine mutigen Investitionen in Technologien, die Industrien revolutionieren könnten. Dieses Vorhaben ist eine natürliche Fortsetzung seiner Vision, die kritische Infrastruktur, die AI-Systeme antreibt, zu verbessern.
Markt im Umbruch: Der AI-Chip-Markt steht an einem Scheideweg, wobei sowohl Tech-Giganten als auch Startups um die Vorherrschaft kämpfen. SoftBanks Einstieg könnte die Entwicklung von Chip-Technologien der nächsten Generation vorantreiben, die beispiellose Rechenleistung bieten.
Mehr als nur Profit: Son strebt danach, Technologie einzusetzen, um einige der dringendsten Herausforderungen der Welt zu bewältigen. Von der Gesundheitsversorgung bis zum Umweltschutz könnte AI revolutionäre Lösungen bieten.
Aufruf an Investoren und Innovatoren: Das Ziel, 100 Milliarden Dollar zu sichern, verdeutlicht das Ausmaß von Sons Vision.
Stable Diffusion 3: Neue Maßstäbe in der AI-Bildgenerierung
Ein strategischer Schachzug: Stability AI kündigt mit Stable Diffusion 3 (SD3) die neueste und leistungsfähigste Version seines Bildgenerierungs-AI-Modells an. Dieser Schritt zielt darauf ab, den Hype um die kürzlich angekündigten Konkurrenten von OpenAI und Google, Sora und Gemini, in Schach zu halten.
Technologische Innovation: SD3 basiert auf einer neuen Architektur und nutzt einen aktualisierten "Diffusion Transformer" sowie die neuartige "Flow Matching"-Technik. Diese Entwicklungen versprechen eine verbesserte Qualität bei geringerem Overhead.
Vielfältige Skalierbarkeit: Das Modell deckt eine Spanne von 800 Millionen bis 8 Milliarden Parametern ab und ist auf verschiedenster Hardware lauffähig, wobei für optimale Leistung weiterhin leistungsstarke GPUs empfohlen werden.
Erweiterung der Funktionalität: Laut Emad Mostaque, dem Kopf hinter Stable Diffusion, wird das neue Modell multimodales Verständnis sowie Videoeingabe und -generierung unterstützen, Fähigkeiten, die bisher nur theoretisch sind, aber in zukünftigen Versionen enthalten sein könnten.
Sicherheit im Fokus: Stability AI betont die Bedeutung von Sicherheitsmaßnahmen, um Missbrauch zu verhindern. Die Firma arbeitet kontinuierlich mit Forschern und der Community zusammen, um die Integrität des Modells zu wahren.
Noch im Verborgenen: Während technische Details und spezifische Sicherheitsvorkehrungen noch ausstehen, unterstreicht die Ankündigung das Engagement von Stability AI für Innovation und Sicherheit.
Google entschuldigt sich für historische Ungenauigkeiten durch Gemini
Kontroverse um KI-Generierte Bilder: Google hat sich für die durch sein Gemini AI-Tool verursachten "Ungenauigkeiten in einigen historischen Bildgenerierungen" entschuldigt. Die Kritik entzündete sich an Bildern, die historische Figuren oder Gruppen fälschlicherweise als Personen mit unterschiedlicher Hautfarbe darstellten, möglicherweise als Überkorrektur langjähriger rassistischer Vorurteile in der KI.
Diversität als Ziel und Herausforderung: Gemini versuchte, eine breite Palette von Ergebnissen zu erzeugen, um der Vielfalt der Nutzer weltweit gerecht zu werden. Google räumt jedoch ein, dass das Tool hierbei das Ziel verfehlt hat.
Soziale Medien entfachen Debatte: Die Diskussion wurde hauptsächlich von rechtsgerichteten Persönlichkeiten angeheizt, die das liberale Image von Google kritisierten. Die Debatte entflammte um die Darstellung von historisch weißen Figuren und Gruppen als nicht-weiße Personen in den AI-generierten Bildern.
Verweigerung bestimmter Bildgenerierungen: Gemini scheint derzeit einige Bildgenerierungsaufgaben abzulehnen.
Googles Entschuldigung für die durch Gemini verursachten historischen Ungenauigkeiten zeigt die komplexen Herausforderungen bei der Erstellung von KI-generierten Bildern auf, insbesondere im Bemühungen, Vielfalt und Inklusion zu fördern.
Google DeepMind gründet eine neue Organisation für KI-Sicherheit
Neue Initiative für KI-Sicherheit: Google DeepMind, die AI-Forschungs- und Entwicklungsabteilung hinter vielen von Googles jüngsten generativen AI-Projekten, hat die Gründung einer neuen Organisation bekannt gegeben: AI Safety and Alignment. Diese Organisation umfasst bestehende Teams, die an KI-Sicherheit arbeiten, sowie neue, spezialisierte Gruppen von Forschern und Ingenieuren im Bereich der generativen KI.
Fokus auf AGI-Sicherheit: Ein Schwerpunkt der neuen Organisation ist die Sicherheit rund um künstliche allgemeine Intelligenz (AGI), also hypothetische Systeme, die jede Aufgabe ausführen können, die ein Mensch kann. Dies beinhaltet auch ein neues Team, das sich auf die Sicherheit von AGI konzentriert.
Zweifache Strategie: Neben der neuen Gruppe innerhalb von AI Safety and Alignment arbeitet das bereits bestehende Forschungsteam in London, Scalable Alignment, weiterhin an Lösungen für die technische Herausforderung, superintelligente KI zu kontrollieren.
Sicherheitsvorkehrungen im Vordergrund: Die Organisation wird konkrete Sicherheitsmaßnahmen in Googles Gemini-Modelle integrieren, sowohl in aktuelle als auch in Entwicklung befindliche. Zu den kurzfristigen Schwerpunkten gehören die Verhinderung schlechter medizinischer Ratschläge, die Gewährleistung der Kindersicherheit und die Vermeidung der Verstärkung von Vorurteilen und anderen Ungerechtigkeiten.
Leitung durch Anca Dragan: Die Organisation wird von Anca Dragan, ehemalige Forschungswissenschaftlerin bei Waymo und Professorin für Informatik an der UC Berkeley, geleitet. Dragan bringt umfangreiche Erfahrung in der Forschung zur Mensch-KI- und Mensch-Roboter-Interaktion mit.
Steigendes Misstrauen gegenüber GenAI-Tools: Skepsis gegenüber generativen AI-Tools, insbesondere im Hinblick auf Deepfakes und Fehlinformationen, ist hoch. Untersuchungen zeigen, dass ein Großteil der Amerikaner besorgt über die Verbreitung irreführender Deepfakes ist und dass viele erwarten, dass AI-Tools im Wahlzyklus 2024 die Menge an falschen und irreführenden Informationen erhöhen werden.
Bedeutung: Die Gründung der AI Safety and Alignment Organisation durch Google DeepMind unterstreicht die zunehmende Bedeutung von Sicherheit und ethischen Überlegungen in der Entwicklung generativer KI-Technologien. Angesichts der wachsenden Bedenken hinsichtlich der Genauigkeit und Zuverlässigkeit von KI-generierten Inhalten zielt diese Initiative darauf ab, robustere und sicherere Modelle zu entwickeln, die menschliche Präferenzen und Werte besser verstehen und respektieren. Dies ist ein entscheidender Schritt, um das Vertrauen der Öffentlichkeit und der Regulierungsbehörden in KI-Technologien zu stärken und die potenziellen Risiken, die mit fortschrittlichen KI-Anwendungen verbunden sind, zu minimieren.
Groq's AI-Chip lässt Elon Musks Grok hinter sich
Innovativer Durchbruch in der AI-Technologie: Groq, ein Unternehmen für AI-Chips, stellt seine Konkurrenten in den Schatten. Mit blitzschnellen Demos, die viral gingen, positioniert sich Groq als Turboantrieb für die AI-Industrie und stellt aktuelle Versionen von ChatGPT, Gemini und Grok in den Schatten.
Schnellere Große Sprachmodelle: Groq behauptet, „die weltweit schnellsten LLMs“ zu bieten, eine Behauptung, die durch Drittanbieter-Tests gestützt wird. In Sekundenbruchteilen produziert Groq hunderte Wörter in einer faktischen Antwort und zitiert dabei Quellen.
Sprachverarbeitungseinheiten (LPUs): Groqs AI-Chips, bekannt als Language Processing Units (LPUs), sollen schneller sein als Nvidias Graphics Processing Units (GPUs), die allgemein als Branchenstandard für das Ausführen von AI-Modellen gelten.
Inferenzmaschine statt Chatbot: Groq fungiert als „Inferenzmaschine“, die Chatbots wie ChatGPT, Gemini oder Grok unglaublich schnell laufen lässt, anstatt sie vollständig zu ersetzen. Auf Groqs Website kann man verschiedene Chatbots testen und sehen, wie schnell sie mit Groqs LPUs laufen.
Signifikante Beschleunigung: Groq produziert 247 Tokens/Sekunde im Vergleich zu Microsofts 18 Tokens/Sekunde. Dies bedeutet, dass ChatGPT mehr als 13-mal schneller laufen könnte, wenn es auf Groqs Chips betrieben wird.
Relevanz für Echtzeitkommunikation: Die erhöhte Geschwindigkeit von Groq könnte AI-Chatbots wie ChatGPT, Gemini und Grok deutlich nützlicher machen, indem sie die aktuellen Limitationen überwinden und mit Echtzeit-Menschensprache mithalten können.
Hier ist ein eindrucksvolles Video zu Groq: https://www.youtube.com/watch?v=pRUddK6sxDg
Bedeutung: Groqs Durchbruch in der AI-Chiptechnologie könnte die AI-Welt revolutionieren und neue Möglichkeiten für die Echtzeitkommunikation mit AI-Chatbots schaffen. Die Fähigkeit, große Sprachmodelle mit beispielloser Geschwindigkeit auszuführen, stellt einen signifikanten Fortschritt dar, der praktische Anwendungsfälle in der realen Welt ermöglichen könnte. Dieser Fortschritt unterstreicht die zunehmende Bedeutung von spezialisierten AI-Chips für die Weiterentwicklung und Skalierung von AI-Anwendungen, ein Bereich, der auch von Branchengrößen wie OpenAI und Google intensiv erforscht wird. Groqs Innovationen könnten nicht nur die Leistungsfähigkeit von AI-Modellen steigern, sondern auch neue Standards für Geschwindigkeit und Effizienz in der AI-Industrie setzen.
AI-Soundeffekte kommen bald: Eine neue Ära der Audiogenerierung
Innovation von ElevenLabs: Stell dir vor, du könntest einen Klang beschreiben und ihn mit AI generieren. Das Team von ElevenLabs hat einen Teaser ihrer kommenden Soundeffekte geteilt, die genau das ermöglichen.
Textgesteuerte Klangerzeugung: Mit Textprompts wie „Wellen, die brechen“, „Metall, das klingt“, „Vögel, die zwitschern“ und „Motorengeräusch eines Rennwagens“.
Begeisterung in der Community: Die Vorfreude und Unterstützung aus der Community sind enorm. Ein öffentliches Veröffentlichungsdatum steht noch aus, aber Interessierten können ihre Informationen hinterlassen, um zu den Ersten zu gehören, die Neuigkeiten erhalten.
Bedeutung: Die Möglichkeit, Soundeffekte allein durch die Beschreibung mit Text zu generieren, öffnet neue kreative Wege in der Audioproduktion und darüber hinaus. Diese Technologie hat das Potenzial, die Erstellung von Soundeffekten zu demokratisieren, indem sie Nutzern ohne umfangreiche Audioerfahrung oder -ausrüstung ermöglicht, hochwertige Sounds zu erstellen. Von Filmemachern bis hin zu Spieleentwicklern könnte jeder von dieser Innovation profitieren und so ihre Projekte mit individuell erstellten Klängen bereichern. Die Vorstellung von ElevenLabs Soundeffekten signalisiert einen spannenden Schritt vorwärts in der Welt der generativen AI und erweitert die Grenzen dessen, was kreativ möglich ist.
Disney Accelerator feiert das 10. Jubiläum mit innovativen Teilnehmern für 2024
Die Walt Disney Company hat heute das 10-jährige Jubiläum des Disney Accelerator-Programms bekannt gegeben, einem Geschäftsentwicklungsprogramm, das darauf abzielt, das Wachstum innovativer Unternehmen aus der ganzen Welt zu beschleunigen. Zum zehnten Jahrestag der Investition in Innovation durch den Disney Accelerator wurden auch die fünf Unternehmen vorgestellt, die am Programm 2024 teilnehmen werden.
Teilnehmende Unternehmen 2024:
- AudioShake: Ein Audio-Technologieunternehmen, das KI nutzt, um die Schichten aufgezeichneter Sounds zu trennen, wodurch Audio interaktiv, bearbeitbar und anpassbar wird.
- ElevenLabs: Ein Unternehmen für Sprach-KI-Forschung und -Einsatz, das realistische, vielseitige und kontextbewusste AI-Audio erstellt.
- Nuro: Ein Unternehmen für autonome Fahrzeuge, das spezielle, elektrische Fahrzeuge ohne Insassen für die Warenlieferung baut.
- PrometheanAI: Bietet ein Toolset für die Erstellung virtueller Welten und die Verwaltung digitaler Assets mit natürlichen Sprachbefehlen.
- StatusPro: Ein Unternehmen für immersives Entertainment, das virtuelle und erweiterte Realität nutzt, um First-Person-Sportspielerlebnisse zu schaffen.
Die Unternehmen des Disney Accelerator 2024 teilen Disneys Engagement, die Vorteile zu erforschen, die Künstliche Intelligenz bieten kann, um menschliche Vorstellungskraft und Kreativität auf verantwortungsvolle und ethische Weise zu ermöglichen.
Seit seiner Gründung im Jahr 2014 hat der Disney Accelerator mehr als 60 globale Unternehmen, darunter Innovatoren wie Epic Games, Kahoot!, Illumix und Inworld, mit der Kreativität, Vorstellungskraft und dem Fachwissen von Disney verbunden.