技术速递|使用 .NET 为 Microsoft AI 构建可扩展网关

作者:Kara Saucerman
排版:Alan Wang

Microsoft AI 团队构建了全面的内容、服务、平台和技术,以便消费者在任何设备上、任何地方获取他们想要的信息,并为企业改善客户和员工的体验。我们的团队支持多种体验,包括 Bing、Copilot、广告、地图和 Edge,并通过 Edge 新标签页、Windows 10 和 11 等入口点呈现,这些入口点每月有超过 10 亿活跃用户。我们意识到需要一个高性能且可靠的网关作为 Microsoft AI 的前端和入口层。这将使多个团队能够利用我们开发的通用功能来帮助运营业务并专注于客户体验和功能。在本文中,我们将介绍在 .NET 8 上借助 YARP 构建网关(代号为 CETO)的过程。
在这里插入图片描述

反向代理

在开始编写 CETO 之前,我们必须决定使用反向代理。我们应该使用外部的还是尝试自己制作?这些外部的能涵盖我们所有的用例吗?我们还必须考虑定制这些代理的高成本和持续维护。我们的需求包括支持 HTTP/2、HTTP/3、WebSocket 等流协议、简单的可扩展性等等。当我们开始了解 Microsoft 其他内部团队正在做的事情时,我们遇到了 YARP 项目。YARP 代表:“又一个反向代理”。该项目使用 ASP.NET 和 .NET(.NET 6 及更高版本)提供一个灵活的解决方案,可以通过 .NET 代码进行修改。这有多方便呢?事实证明这正是我们所需要的。

Bing 运行着世界上最大、高性能且可靠的 .NET 应用程序之一。我们依赖于与 .NET 团队的密切合作关系,并且是每个 .NET 版本的早期采用者。通过尝试并升级到每个新版本,我们可以向 .NET 团队提供有用的反馈。这有助于我们的平台和那些将升级服务以使用这些新版本的外部客户。我们将 YARP 纳入该反馈周期。

在现代 .NET 上创建新服务

由于 CETO 是一项新的服务,我们当时有机会使用最新的.NET版本。如今,它构建在 .NET 8、Kestrel + YARP 2.1 之上,可以在多个基础设施平台和数千台服务器上运行,既支持Linux容器也支持Windows容器。跨平台运行的能力增加了我们模块的可移植性和兼容性,以及在任何地方部署的灵活性和效率。在这个层面上的性能非常快,每一毫秒都至关重要。CPU%较低,从而降低了运营成本。

CETO 通过统一我们平台上的业务逻辑来实现融合,然后将请求交给 YARP,以完成路由到适当上游服务的繁重工作。我们希望我们的路由和映射能够高度定制化,因为我们要处理许多具有不同流量模式的不同群体,这会影响其他关键功能。

灵活性至关重要

我们对如何使用 .NET 和 YARP 有很多选择和控制权,因为它们非常灵活且功能多样。.NET提供了各种各样的API,以满足不同的需求,例如配置、依赖注入、日志记录、测试和调试等。通过使用 .NET,我们的 CETO 开发人员可以编写灵活、易于维护的代码,无缝连接到我们的其他服务。

我们采取了以下几种方法来满足我们的需求:

我们希望从一个中心位置管理我们内部团队的客户流量路由和目的地。使用 YARP,我们可以通过提供几个实现 IProxyConfigProvider 和 IProxyConfig 接口的类来选择从外部加载配置。团队可以创建任意数量的简单或复杂的路由,并与其他团队分开部署。更改会在后台重新加载,然后我们用新的快照交换代理配置状态,通知旧的配置已过时。

由于使用完整的 YARP 代理,我们具有路由和负载平衡的优势。我们希望提供一个选项,当从服务收到某些 http 状态代码时,转发到另一个位置。团队可以在 YARP 路由配置的 IReadOnlyDictionary<string, string> 元数据部分中设置此配置。我们在响应返回到客户端之前对其进行检查,从匹配的路由中获取元数据,然后使用 direct IHttpForwarder 将请求转发到另一个位置。通过使用 IHttpForwarder,我们仍然可以获得这些请求的错误处理、流协议和 http 客户端定制。

YARP 有多种默认的负载均衡策略,适合大多数场景。我们不需要修改这些策略的目标选择,而是干预选择过程并做一些其他事情。从 ILoadBalancingPolicy 创建一个新策略并利用目标属性中的 IReadOnlyDictionary<string, string> 元数据,我们可以对特定目标进行分类以用于其他目的。
在这里插入图片描述
在这种情况下,我们希望将一定比例的请求镜像到不同的目的地。流量镜像或流量阴影用于将生产流量重播到测试环境中,而不影响最终用户体验。请求被克隆并发送到队列进行处理,同时我们继续正常的选择逻辑,为请求选择可用的目标(不是镜像类型)。

.NET 速率限制是另一个便于使用的功能。它具有使用 PartitionedRateLimiter 的选项,可以基于任何唯一的 UserId 或其他标识符设置速率限制策略。我们通过使用 YARP RouteId 作为密钥的一部分来实现每个路由的速率限制。这些路由的所有者可以直接在 YARP 路由配置(元数据部分)中指定他们的许可值,并将其传递给速率限制器扩展。该密钥被创建为 routeId + 唯一标识符,以便当团队更新其许可限制时,我们会生成一个新密钥。限速库可以自动获取这些信息,无需重启服务。如果策略已经存在,速率限制将不会更新权限限制,因此我们创建一个新密钥。库会在大约 30 秒后删除过时的策略。这使我们可以保护每条路由的服务并有能力在单一位置管理我们团队。

大多数 CETO 配置使用 .NET 中的 Configure 和 IOptionsMonitor 接口以及 Json 配置提供程序。IOptionsMonitor 接口用于检索选项并管理 IOptions 实例的选项通知。

配置是通过我们的自定义服务扩展 AddSingletonServiceConfig 添加的,该扩展使用 ConfigurationBuilder 按顺序加载(以最后加载的键为准):

  • 默认值 services.Configure(serviceConfig.GetSection(“Default”));
  • 环境组值 services.Configure(serviceConfig.GetSection(environmentAlias));
  • 每个环境值 services.Configure(serviceConfig.GetSection(environmentName));

然后将配置添加到接收 IOptionsMonitor 的单例 IConfigurationReader 中。

简单示例:
在这里插入图片描述
在环境 2(生产组的一部分)上启动服务时,会产生以下配置:

"ModuleA": {
  "SSLCertificateSecretIdentifier": "ProdCert",
  "PollingIntervalInSec": 30
},

当模块所有者想要添加新配置时,他们会创建一个新的模式模型作为 C# 类,添加 Json 配置文件,并更改 CETO 以调用我们的服务扩展。他们的类现在通过依赖注入接收特定于运行时的配置。由于我们使用 IOptionsMonitor,它还支持更改通知的功能。

性能很重要,.NET 8 速度更快

我们始终对我们的服务表现负责。随着服务所有者不断增加功能数量,延迟时间可能会逐渐增加。每个 .NET 版本都带来了性能改进。我们很高兴能够免费升级并获得这些性能改进。然而,我们仍然需要定期分析我们的服务,以确保我们明智地使用我们的资源。对于我们的开发人员来说,阅读开发博客文章以获取有用的提示非常有用。

展望未来

通过使用现代 .NET 及其功能,我们能够毫不费力地为我们的组织创建一个有效且高质量的网关。我们展示了几个示例,说明如何轻松扩展 .NET 库以满足我们组织的需求。我们对未来的 .NET 版本以及我们与 .NET 团队的持续合作充满期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/600146.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

通过氧气退火增强β-Ga₂O₃二极管.中国科技大学和河北半导体研究所的研究人员在这一特定领域取得了最新重大进展

上图所示&#xff1a;&#xff08;a&#xff09;增加台面有助于提高β-Ga2O3肖特基势垒二极管的阻断电压&#xff08;b&#xff09;。 氧气退火和自对准台面终端使β-Ga2O3二极管进一步走向商业化。 虽然β-Ga2O3电力电子技术已经取得了长足的进步&#xff0c;但仍然存在挑战&…

.双链表.

题目&#xff1a; 实现一个双链表&#xff0c;双链表初始为空&#xff0c;支持 55 种操作&#xff1a; 在最左侧插入一个数&#xff1b;在最右侧插入一个数&#xff1b;将第 k&#x1d458; 个插入的数删除&#xff1b;在第 k&#x1d458; 个插入的数左侧插入一个数&#xf…

Redis(Redis配置和订阅发布)

文章目录 1.Redis配置1.网络配置1.配置文件位置 /etc/redis.conf2.bind&#xff08;注销支持远程访问&#xff09;1.默认情况bind 127.0.0.1 只能接受本机的访问2.首先编辑配置文件3.进入命令模式输入/bind定位&#xff0c;输入n查找下一个&#xff0c;shift n查找上一个&…

书生·浦语大模型实战营之XTuner多模态训练与测试

书生浦语大模型实战营之XTuner多模态训练与测试 目录 XTuner多模态训练与测试给LLM装上电子眼&#xff1a;多模态LLM原理简介文本单模态文本图像多模态 电子眼&#xff1a;LLaVA方案简介LLaVA训练阶段示意图LLaVA测试阶段示意图 项目实践环境准备XTuner安装概述Pretrain阶段Fi…

NVIDIA_SMI has failed because it couldn’t communicate with the NVIDIA driver

参考&#xff1a;https://www.zhihu.com/question/474222642/answer/3127013936 https://blog.csdn.net/ZhouDevin/article/details/128265656 nvidia-smi查看报错&#xff0c;nvcc正常 1&#xff09;查看nvidia版本 ls /usr/src | grep nvidia nvidia-550.78 2&#xff09;…

无线通信基础

这里写目录标题 通信概述什么是无线通信无线通信电磁波 通信概述 什么是无线通信 无线通信 : 是指利用电磁波信号可以在自由空间中传播的特性进行信息交换的一种通信方式 无线通信的关键技术包括调制技术、解调技术、信道编码技术、信号处理技术、天线技术等。这些技术的不断…

【mobx-入门与思考】

介绍 mobx 是 nodejs生态中的框架&#xff0c; 主要用于做状态管理&#xff0c;可以监控变量状态的变化。 nodejs中除了mobx&#xff0c;还有个redux&#xff0c;也是做状态管理的&#xff0c;都是比较成熟的框架&#xff0c;二者的选择可以参考 【nodejs状态管理: Redux VS M…

太原理工大学Python数据分析原理与应用(课外考题:8~11章)

这部分大概只考10分&#xff0c;且大部分出在选择题&#xff0c;填空最多一两个 (仅供参考) 第十章 (理解概念为主&#xff0c;无需看推导过程) 第十一章

1-1ARM开发环境搭建(GD32)

1:安装MDK最好是5.27以及以上版本&#xff0c;避免后续学习中出现相关错误 2&#xff1a;安装芯片支持包 双击安装即可&#xff0c;也可以是默认路径&#xff0c;也可以自己更改路径 3&#xff1a;安装jlink下载器驱动&#xff08;下载调试器&#xff09; 具体安装步骤如下所示…

Java 线程池 ( Thread Pool )的简单介绍

想象一下&#xff0c;你正指挥着一支超级英雄团队&#xff0c;面对蜂拥而至的敌人&#xff08;任务&#xff09;&#xff0c;不是每次都召唤新英雄&#xff08;创建线程&#xff09;&#xff0c;而是精心调配现有成员&#xff0c;高效应对。这就是Java线程池的魔力&#xff0c;…

重装win11系统后找不到WiFi

由于电脑崩溃重装了系统&#xff0c;win11,装完之后WiFi图标不见了且网络适配器根本没有无线网络选项。 右键电脑》管理》网络适配器。 在刚装好系统时候并没有前两项&#xff0c;查了很多资料&#xff0c;比如 关机14s 重启&#xff0c;还有通过服务配置 WLAN AutoConfig 都…

从0到1提审苹果商店(appstore)上线一款新APP

本篇主要复盘和介绍一款APP如何从0到1上线到苹果商店,将我自己项目遇到的坑跟大家分享,希望能为同样做开发或者运营的你提供经验,少走弯路。 如果你是24年1月1日之后开始首次提审APP,还需要先将自己的APP在工信部备案,苹果后台增加了工信部备案号的填写,备案方法和经验如…

如何去官网下载windows10操作系统iso镜像

文章目录 一、先从微软中国官网https://www.microsoft.com/zh-cn/进去二、然后按图示一步步点进去三、点击下载工具这个工具会帮你生成windows操作系统iso文件四、下载好后一步步按图示要求成功操作一、先从微软中国官网https://www.microsoft.com/zh-cn/进去 二、然后按图示一…

JAVA面向对象高级部分

内部类 内部类的四种形式 内部类概述、成员内部类 代码示例 创建对象的格式 通过对象名访问内部类方法 若内外部类的成员变量名冲突&#xff0c;如何在内部类分别访问外部成员变量。 总结 静态内部类 代码示例 访问静态内部类的方法 不能在静态内部类中访问实例成员变量 …

视频素材库在哪里找免费手机版?8个可以用手机浏览的素材网

在视觉内容占据主导地位的今天&#xff0c;合适的视频素材可以大大提升项目的吸引力和效果。以下列出的视频素材网站为广告制作者、社交媒体策略师及电影制作人提供了从传统到现代风格的各种视频素材选择&#xff0c;满足不同的创作需求。 1. 蛙学府&#xff08;中国&#xff…

展开说说:Android线程池解析

何谓线程池&#xff1f;本人理解是存放和管理线程的一个容器。 线程池存在的意义是什么&#xff1f; 第一&#xff1a;前面博客提到过创建和销毁线程的操作本身是有性能开销的&#xff0c;如果把使用的线程对象存起来下次用的时候直接取出来用就省去了一次创建和销毁的成本&a…

Scroll生态项目Penpad,再获Presto Labs的投资

Penpad是Scroll生态的LaunchPad平台&#xff0c;其整计划像收益聚合器以及RWA等功能于一体的综合性Web3平台拓展&#xff0c;该平台在近期频获资本市场关注&#xff0c;并获得了多个知名投资者/投资机构的支持。 截止到本文发布前&#xff0c;Penpad已经获得了包括Scroll联合创…

基于vue.js+thymeleaf模板引擎+ajax的注册登陆简洁模板(含从零到一详细介绍)

文章目录 前言1、数据库准备2、工具类与相关基类使用2.1、工具类2.2、相关基类 3、web包目录说明4、注册功能设计&#xff08;本文核心部分&#xff09;4.1、注册页面设计4.2、注册逻辑设计 5、登陆功能设计5.1、登陆页面设计5.2、登陆逻辑设计 6、运行效果图 前言 大多数的网…

(MATLAB)安装指南

参考链接&#xff1a;MATLAB2019a安装教程&#xff08;避坑版&#xff09;

智能健康管理系统的一次新体验

智能健康管理系统是一个集成了多方面数据资源&#xff0c;并配合人工智能算法的健康管理系统。该系统的应用涉及多个领域&#xff0c;包括医学、科学、生态和医疗保健等。其服务对象包括健康人群、亚健康人群和疾病人群&#xff0c;旨在通过病因预防、临床前期预防和临床预防三…
最新文章